AI Data Research Engineer ― AIモデル性能を決める「データ設計・評価ループ」の中核エンジニア ―
仕事概要
■ 募集背景
APTOでは、AIモデル開発に不可欠な学習データの生成・整備・評価プロセスをプロダクトとして提供しています。
近年、
- LLM / VLM / 画像・動画モデルなど 扱うモデルの高度化
- 本番運用を前提とした データ量・品質要件の急激な引き上げ
- 顧客ごとに異なる 「モデル性能を左右するデータ要件」
が同時に進み、モデルそのもの以上に「データ設計と評価ループ」がプロダクトの競争力を左右するフェーズに入っています。
現在は、
- データ設計や評価改善が属人的になっている
- モデル改善のボトルネックがデータ側にあるが、体系化しきれていない
という課題を抱えており、AIモデルの性能を「データの観点から」引き上げられるエンジニアをR&Dの中核メンバーとして迎えたいと考えています。
■ このポジションの役割
本ポジションは、モデルを作るエンジニアではありません。
モデルが「本番で機能する状態」を、データ設計で実現するエンジニアです。
主な役割
- LLM / VLM / 画像・動画モデル向けの 学習データ設計
- データ前処理・アノテーション方針の設計・改善
- モデル評価指標の設計、評価結果の分析
- 学習 → 評価 → データ改善 の フィードバックループ構築
- モデル開発チーム・プロダクトチームとの連携
「なぜ精度が出ないのか」「どのデータをどう変えるべきか」をデータ側から考え、実行する役割です。
■ 主軸(最も期待する領域)
- AIモデル向けデータ設計・前処理・品質管理
- モデル評価とデータ改善ループの設計
- Pythonを用いたデータ処理・分析
■ 扱う対象例
- LLM / VLM 向けテキスト・画像・動画データ
- 物体検知・画像認識モデル向けデータ
- アノテーションデータ・メタデータ
※モデルの重み設計やアルゴリズム研究が主業務ではありません。
「データ × モデル性能」の実運用設計が中心です。
■ 任せたい裁量・意思決定範囲
- 学習データの設計方針・品質基準の策定
- モデル評価指標・評価方法の設計
- アノテーション改善・再設計の判断
- モデル改善に向けた データ戦略の主導
データに関する意思決定を、エンジニアとして主体的に担っていただきます。
■ このポジションで得られるもの
- AIモデル性能を左右するデータ設計の実戦経験
- LLM / VLM 等の最新モデルを「使い切る」視点
- 学習 → 評価 → 改善を回す 実運用の知見
必須スキル
以下すべてを満たす必要はありませんが、学習データや評価設計について「自ら考え、改善した経験」を重視します。
- 機械学習モデル(分類・検出・生成系など)を扱い、モデル性能向上を目的として学習データの設計・改善に関与した実務経験(研究・プロダクトいずれも可)
- Python を用いて、学習・評価用データの前処理、加工、検証を自ら設計・実装した経験
- モデル評価結果を踏まえ、「データをどう変えれば性能が改善するか」を考え、実際に施策を実行した経験(再アノテーション、データ追加、分布調整、ラベル定義の見直し等)
歓迎スキル
- LLM / VLM / 画像・動画モデルにおけるタスク特性を踏まえたデータ構成・粒度・ラベル設計の経験
- アノテーション業務における、ガイドライン設計、品質基準策定、レビュー、改善サイクル運用の経験
- 精度・再現率・F1・BLEU 等の指標を用いた評価結果の解釈・ボトルネック分析の経験
- 学習 → 評価 → 改善を意識したデータパイプラインやRLHF基盤構築のご経験
- Data-centric AI / MLOps といった考え方に基づき、モデルだけでなくデータ設計に価値を置いた開発に関心がある方
- 研究コミュニティでのアウトプットとして、学会等での論文発表/査読付き発表などの実績がある方
- 生成AI(LLM/AIエージェント等)を用いた開発経験があり、エージェント設計・ツール連携(Function calling等)・RAG/検索・マルチモーダル文書理解(VLM/OCR)・安全運用(ファクトチェック/ガードレール)・タスク特化ベンチマークによる継続評価のいずれかに知見/実装経験(または強い関心)がある方
- 強化学習を含む学習手法や、課題設定〜分析〜実装〜検証までのDSプロセス、および AI支援コーディングツールの活用・運用の経験
- Robotics・Physical AI領域におけるデータ作成(IL用データ収集・VLA学習用データの生成・評価設計等)の経験がある方
求める人物像
- モデル単体よりも 「データと評価で性能を上げる」ことに面白さを感じる方
- 研究だけでなく、実運用されるAIプロダクトに関わりたい方
- モデル開発者と対話しながら、データ設計をリードしたい方
- AIプロダクトの“裏側の要”として責任を持ちたい方
※純粋なアルゴリズム研究のみを志向する方には向きません。
応募概要
| 給与 | 応相談(経験等に応じて600万円 ~ 1500万円程度を想定) |
|---|---|
| 勤務地 | 東京都千代田区岩本町 2-4-1 神田岩本町プラザビル504 |
| 雇用形態 | 正社員 |
| 勤務体系 | 勤務時間:フレックスタイム制(コアタイム:11:00〜15:00) |
| 福利厚生 | ◾️休日・休暇 ◾️福利厚生 |
企業情報
| 企業名 | 株式会社APTO |
|---|---|
| 設立年月 | 2020年1月20日 |
| 本社所在地 | 東京都千代田区岩本町2丁目4−1 神田岩本町プラザビル504 |
| 従業員数 | 30名 |
| 企業サイトURL | https://apto.co.jp/ |