AI Data Research Engineer

株式会社APTO

AI Data Research Engineer ― AIモデル性能を決める「データ設計・評価ループ」の中核エンジニア ―

APTOでは、AIモデル開発に不可欠な学習データの生成・整備・評価プロセスをプロダクトとして提供しています。

近年、

が同時に進み、モデルそのもの以上に「データ設計と評価ループ」がプロダクトの競争力を左右するフェーズに入っています。

現在は、

という課題を抱えており、AIモデルの性能を「データの観点から」引き上げられるエンジニアをR&Dの中核メンバーとして迎えたいと考えています。

本ポジションは、モデルを作るエンジニアではありません。
モデルが「本番で機能する状態」を、データ設計で実現するエンジニアです。

「なぜ精度が出ないのか」「どのデータをどう変えるべきか」をデータ側から考え、実行する役割です。

※モデルの重み設計やアルゴリズム研究が主業務ではありません。

「データ × モデル性能」の実運用設計が中心です。

データに関する意思決定を、エンジニアとして主体的に担っていただきます。

以下すべてを満たす必要はありませんが、学習データや評価設計について「自ら考え、改善した経験」を重視します。

機械学習モデル（分類・検出・生成系など）を扱い、モデル性能向上を目的として学習データの設計・改善に関与した実務経験（研究・プロダクトいずれも可）
Python を用いて、学習・評価用データの前処理、加工、検証を自ら設計・実装した経験
モデル評価結果を踏まえ、「データをどう変えれば性能が改善するか」を考え、実際に施策を実行した経験（再アノテーション、データ追加、分布調整、ラベル定義の見直し等）

LLM / VLM / 画像・動画モデルにおけるタスク特性を踏まえたデータ構成・粒度・ラベル設計の経験
アノテーション業務における、ガイドライン設計、品質基準策定、レビュー、改善サイクル運用の経験
精度・再現率・F1・BLEU 等の指標を用いた評価結果の解釈・ボトルネック分析の経験
学習 → 評価 → 改善を意識したデータパイプラインやRLHF基盤構築のご経験
Data-centric AI / MLOps といった考え方に基づき、モデルだけでなくデータ設計に価値を置いた開発に関心がある方
研究コミュニティでのアウトプットとして、学会等での論文発表／査読付き発表などの実績がある方
生成AI（LLM/AIエージェント等）を用いた開発経験があり、エージェント設計・ツール連携（Function calling等）・RAG/検索・マルチモーダル文書理解（VLM/OCR）・安全運用（ファクトチェック/ガードレール）・タスク特化ベンチマークによる継続評価のいずれかに知見／実装経験（または強い関心）がある方
強化学習を含む学習手法や、課題設定〜分析〜実装〜検証までのDSプロセス、および AI支援コーディングツールの活用・運用の経験
Robotics・Physical AI領域におけるデータ作成（IL用データ収集・VLA学習用データの生成・評価設計等）の経験がある方

※純粋なアルゴリズム研究のみを志向する方には向きません。

給与	応相談（経験等に応じて600万円～ 1500万円程度を想定）
勤務地	東京都千代田区岩本町 2-4-1 神田岩本町プラザビル504 ※ハイブリッド勤務（リモートと出社の併用）
雇用形態	正社員
勤務体系	勤務時間：フレックスタイム制（コアタイム：11:00〜15:00）休日・休暇：土日祝日、夏季休暇、年末年始休暇、慶弔休暇
福利厚生	◾️休日・休暇・年次有給休暇・土日祝日・夏季休暇・年末年始休暇・慶弔休暇・産前産後休暇・育児休暇・生理休暇 ◾️福利厚生・各種社会保険完備・交通費全額支給・健康診断・インフルエンザ予防接種・書籍購入費負担・カンファレンス参加費負担・社内勉強会・社内会食費用支援・1on1 ・フリードリンク・モニター貸与・自販機設置"