株式会社APTO 求人一覧AI Data Research Engineer
株式会社APTO 求人一覧
AI Data  Research Engineer

AI Data Research Engineer

株式会社APTO

AI Data  Research Engineer

AI Data Research Engineer ― AIモデル性能を決める「データ設計・評価ループ」の中核エンジニア ―

仕事概要

■ 募集背景

APTOでは、AIモデル開発に不可欠な学習データの生成・整備・評価プロセスをプロダクトとして提供しています。

近年、

  • LLM / VLM / 画像・動画モデルなど 扱うモデルの高度化
  • 本番運用を前提とした データ量・品質要件の急激な引き上げ
  • 顧客ごとに異なる 「モデル性能を左右するデータ要件」

が同時に進み、モデルそのもの以上に「データ設計と評価ループ」がプロダクトの競争力を左右するフェーズに入っています。

現在は、

  • データ設計や評価改善が属人的になっている
  • モデル改善のボトルネックがデータ側にあるが、体系化しきれていない

という課題を抱えており、AIモデルの性能を「データの観点から」引き上げられるエンジニアをR&Dの中核メンバーとして迎えたいと考えています。

■ このポジションの役割

本ポジションは、モデルを作るエンジニアではありません。
モデルが「本番で機能する状態」を、データ設計で実現するエンジニアです。

主な役割
  • LLM / VLM / 画像・動画モデル向けの 学習データ設計
  • データ前処理・アノテーション方針の設計・改善
  • モデル評価指標の設計、評価結果の分析
  • 学習 → 評価 → データ改善 の フィードバックループ構築
  • モデル開発チーム・プロダクトチームとの連携

「なぜ精度が出ないのか」「どのデータをどう変えるべきか」をデータ側から考え、実行する役割です。

■ 主軸(最も期待する領域)

  • AIモデル向けデータ設計・前処理・品質管理
  • モデル評価とデータ改善ループの設計
  • Pythonを用いたデータ処理・分析

■ 扱う対象例

  • LLM / VLM 向けテキスト・画像・動画データ
  • 物体検知・画像認識モデル向けデータ
  • アノテーションデータ・メタデータ

※モデルの重み設計やアルゴリズム研究が主業務ではありません。

「データ × モデル性能」の実運用設計が中心です。

■ 任せたい裁量・意思決定範囲

  • 学習データの設計方針・品質基準の策定
  • モデル評価指標・評価方法の設計
  • アノテーション改善・再設計の判断
  • モデル改善に向けた データ戦略の主導

データに関する意思決定を、エンジニアとして主体的に担っていただきます。

■ このポジションで得られるもの

  • AIモデル性能を左右するデータ設計の実戦経験
  • LLM / VLM 等の最新モデルを「使い切る」視点
  • 学習 → 評価 → 改善を回す 実運用の知見

必須スキル

以下すべてを満たす必要はありませんが、学習データや評価設計について「自ら考え、改善した経験」を重視します。

  • 機械学習モデル(分類・検出・生成系など)を扱い、モデル性能向上を目的として学習データの設計・改善に関与した実務経験(研究・プロダクトいずれも可)
  • Python を用いて、学習・評価用データの前処理、加工、検証を自ら設計・実装した経験
  • モデル評価結果を踏まえ、「データをどう変えれば性能が改善するか」を考え、実際に施策を実行した経験(再アノテーション、データ追加、分布調整、ラベル定義の見直し等)

歓迎スキル

  • LLM / VLM / 画像・動画モデルにおけるタスク特性を踏まえたデータ構成・粒度・ラベル設計の経験
  • アノテーション業務における、ガイドライン設計、品質基準策定、レビュー、改善サイクル運用の経験
  • 精度・再現率・F1・BLEU 等の指標を用いた評価結果の解釈・ボトルネック分析の経験
  • 学習 → 評価 → 改善を意識したデータパイプラインやRLHF基盤構築のご経験
  • Data-centric AI / MLOps といった考え方に基づき、モデルだけでなくデータ設計に価値を置いた開発に関心がある方
  • 研究コミュニティでのアウトプットとして、学会等での論文発表/査読付き発表などの実績がある方
  • 生成AI(LLM/AIエージェント等)を用いた開発経験があり、エージェント設計・ツール連携(Function calling等)・RAG/検索・マルチモーダル文書理解(VLM/OCR)・安全運用(ファクトチェック/ガードレール)・タスク特化ベンチマークによる継続評価のいずれかに知見/実装経験(または強い関心)がある方
  • 強化学習を含む学習手法や、課題設定〜分析〜実装〜検証までのDSプロセス、および AI支援コーディングツールの活用・運用の経験
  • Robotics・Physical AI領域におけるデータ作成(IL用データ収集・VLA学習用データの生成・評価設計等)の経験がある方

求める人物像

  • モデル単体よりも 「データと評価で性能を上げる」ことに面白さを感じる方
  • 研究だけでなく、実運用されるAIプロダクトに関わりたい方
  • モデル開発者と対話しながら、データ設計をリードしたい方
  • AIプロダクトの“裏側の要”として責任を持ちたい方

※純粋なアルゴリズム研究のみを志向する方には向きません。

応募概要

給与

応相談(経験等に応じて600万円 ~ 1500万円程度を想定)

勤務地

東京都千代田区岩本町 2-4-1 神田岩本町プラザビル504
※ハイブリッド勤務(リモートと出社の併用)

雇用形態
勤務体系

勤務時間:フレックスタイム制(コアタイム:11:00〜15:00)
休日・休暇:土日祝日、夏季休暇、年末年始休暇、慶弔休暇

福利厚生

◾️休日・休暇
・年次有給休暇
・土日祝日
・夏季休暇
・年末年始休暇
・慶弔休暇
・産前産後休暇
・育児休暇
・生理休暇

◾️福利厚生
・各種社会保険完備
・交通費全額支給
・健康診断
・インフルエンザ予防接種
・書籍購入費負担
・カンファレンス参加費負担
・社内勉強会
・社内会食費用支援
・1on1
・フリードリンク
・モニター貸与
・自販機設置"

企業情報

企業名
設立年月
本社所在地
従業員数
企業サイトURL