【R&D事業部】【LLM】 Research Engineer
仕事概要
■ 募集背景
APTOでは、AIモデル開発に不可欠な学習データの生成・整備・評価プロセスをプロダクトとして提供しています。
近年、AIモデルの進化に伴い、競争力の源泉はモデル構造そのものから、
「どのようなデータを、どのように設計し、評価し、改善し続けられるか」へと急速にシフトしています。
特に、
・LLM / VLM / マルチモーダルモデルの高度化
・本番運用を前提とした大規模データ要求
・データ品質がモデル性能を直接左右する構造
が同時に進み、AI開発におけるボトルネックは完全に「データ側」に移行しています。
さらに現在は、
・有害データの混入
・バイアスの増幅
・誤学習によるリスク
・評価指標と実運用性能の乖離
といった AIの安全性・信頼性に関わる課題 が顕在化しており、データ設計は単なる精度改善の問題ではなく、AIの社会実装における責任領域へと拡張しています。
APTOでは現在、
・データ設計や評価が属人的に行われている
・モデル改善のボトルネックがデータ側にあるが体系化されていない
・安全性・品質・性能を統合した設計思想が未確立
という課題を抱えており、AIモデル性能と安全性を「データの観点から」引き上げられるResearch Engineerを募集します。
■ このポジションの本質
AIモデルが正しく学習され、安全性・信頼性を担保し、本番環境で信頼できる性能を発揮する状態を、データ設計と評価ループの構築によって実現することを担っていただくポジションです。
扱う対象は単なる学習データではなく、
・モデルの挙動を規定する訓練信号
・評価基準を形作るテストデータ
・安全性を担保するガードレールデータ
といった、AIのモデルの出力特性と性能を規定する要素です。
そのため本ポジションでは、
・どのデータがモデルの意思決定に影響するのか
・どの評価が本番性能を適切に測定できるのか
・どのようなデータ設計が安全性を担保するのか
といった問いに対し、研究的視点と実装視点の両方から取り組むことが求められます。
■ 主な役割
・LLM / VLM / マルチモーダルモデル向けの学習データ設計
・データ前処理・アノテーション方針の設計と改善
・モデル評価指標の設計および評価結果の分析
・学習 → 評価 → データ改善 のフィードバックループ構築
・モデル開発チームとの連携による性能改善
・データ品質・バイアス・安全性に関する設計指針の確立
■ 研究テーマとしての領域
本ポジションでは、以下のような研究的テーマに取り組んでいただく想定です。
データ設計領域
・モデル性能を最大化するデータ分布設計
・データカバレッジと一般化性能の関係
・少量データ環境での効率的データ生成
評価領域
・モデルの実運用性能を反映する評価指標の設計
・評価データセットの品質設計
・自動評価と人手評価の統合設計
AI安全性領域
・有害出力を抑制する訓練データ設計
・バイアス・公平性に関するデータ分析
・安全性評価データセット(ベンチマーク)の設計
・データガバナンス・トレーサビリティ設計
・SFT, RLHFによるモデルの性能向上
■ 主軸(最も期待する領域)
・AIモデル向けデータ設計・品質管理
・モデル評価とデータ改善ループの設計
・Pythonを用いたデータ処理・分析
・データ視点からのモデル性能改善
■ 扱う対象例
・LLM / VLM 向けテキスト・画像・動画データ
・物体検知・画像認識モデル向けデータ
・アノテーションデータ・メタデータ
・安全性評価用データセット
■ このポジションで得られるもの
・AIモデル性能を左右するデータ設計の実務経験。
・最新のLLM / VLM を実運用レベルで扱う希少な機会。
・AIの安全性・信頼性に関わる最前線の課題に取り組む経験。
・研究とプロダクト開発を横断したキャリア。
必須スキル
- 機械学習またはAI関連プロジェクトにおいて、データ前処理・分析・評価設計に関わった経験がある方。
- Pythonを用いたデータ処理・分析経験をお持ちの方。
- モデル性能に対して「データの観点から」改善に取り組んだ経験がある方。
- AIの品質・安全性・バイアス・評価指標といったテーマに関心をお持ちの方。
歓迎スキル
- LLM / VLM / 画像・動画モデルにおけるタスク特性を踏まえたデータ構成・粒度・ラベル設計の経験
- アノテーション業務における、ガイドライン設計、品質基準策定、レビュー、改善サイクル運用の経験
- 精度・再現率・F1・BLEU 等の指標を用いた評価結果の解釈・ボトルネック分析の経験
- 学習 → 評価 → 改善を意識したデータパイプラインやRLHF基盤構築のご経験
- Data-centric AI / MLOps といった考え方に基づき、モデルだけでなくデータ設計に価値を置いた開発に関心がある方
- 研究コミュニティでのアウトプットとして、学会等での論文発表/査読付き発表などの実績がある方
- 生成AI(LLM/AIエージェント等)を用いた開発経験があり、エージェント設計・ツール連携(Function calling等)・RAG/検索・マルチモーダル文書理解(VLM/OCR)・安全運用(ファクトチェック/ガードレール)・タスク特化ベンチマークによる継続評価のいずれかに知見/実装経験(または強い関心)がある方
- 強化学習を含む学習手法や、課題設定〜分析〜実装〜検証までのDSプロセス、および AI支援コーディングツールの活用・運用の経験
- Robotics・Physical AI領域におけるデータ作成(IL用データ収集・VLA学習用データの生成・評価設計等)の経験がある方
求める人物像
- LLM / VLM / マルチモーダルモデルに関する実務経験。
- 評価データセット設計・モデル評価指標設計の経験。
- データ品質管理やアノテーション設計の経験。
- AI安全性・公平性・バイアスに関する研究または実務経験。
- 論文実装・研究活動・学会発表などの経験。
応募概要
| 給与 | 応相談(経験等に応じて600万円 ~ 1500万円程度を想定) |
|---|---|
| 勤務地 | 東京都千代田区岩本町 2-4-1 神田岩本町プラザビル504 ※ハイブリッド勤務(リモートと出社の併用) |
| 雇用形態 | 正社員 |
| 勤務体系 | 勤務時間:フレックスタイム制(コアタイム:11:00〜15:00) 休日・休暇:土日祝日、夏季休暇、年末年始休暇、慶弔休暇 |
| 福利厚生 | ◾️休日・休暇 ・年次有給休暇 ・土日祝日 ・夏季休暇 ・年末年始休暇 ・慶弔休暇 ・産前産後休暇 ・育児休暇 ・生理休暇 ◾️福利厚生 ・各種社会保険完備 ・交通費全額支給 ・健康診断 ・インフルエンザ予防接種 ・書籍購入費負担 ・カンファレンス参加費負担 ・社内勉強会 ・社内会食費用支援 ・1on1 ・フリードリンク ・モニター貸与 ・自販機設置" |
企業情報
| 企業名 | 株式会社APTO |
|---|---|
| 設立年月 | 2020年1月20日 |
| 本社所在地 | 東京都千代田区岩本町2丁目4−1 神田岩本町プラザビル504 |
| 従業員数 | 30名 |
| 企業サイトURL | https://apto.co.jp/ |