【R&D事業部】【LLM】 Research Engineer

株式会社APTO

【R&D事業部】【LLM】 Research Engineer

仕事概要

■ 募集背景 APTOでは、AIモデル開発に不可欠な学習データの生成・整備・評価プロセスをプロダクトとして提供しています。近年、AIモデルの進化に伴い、競争力の源泉はモデル構造そのものから、「どのようなデータを、どのように設計し、評価し、改善し続けられるか」へと急速にシフトしています。特に、・LLM / VLM / マルチモーダルモデルの高度化・本番運用を前提とした大規模データ要求・データ品質がモデル性能を直接左右する構造が同時に進み、AI開発におけるボトルネックは完全に「データ側」に移行しています。さらに現在は、・有害データの混入・バイアスの増幅・誤学習によるリスク・評価指標と実運用性能の乖離といった AIの安全性・信頼性に関わる課題が顕在化しており、データ設計は単なる精度改善の問題ではなく、AIの社会実装における責任領域へと拡張しています。 APTOでは現在、・データ設計や評価が属人的に行われている・モデル改善のボトルネックがデータ側にあるが体系化されていない・安全性・品質・性能を統合した設計思想が未確立という課題を抱えており、AIモデル性能と安全性を「データの観点から」引き上げられるResearch Engineerを募集します。 ■ このポジションの本質 AIモデルが正しく学習され、安全性・信頼性を担保し、本番環境で信頼できる性能を発揮する状態を、データ設計と評価ループの構築によって実現することを担っていただくポジションです。扱う対象は単なる学習データではなく、・モデルの挙動を規定する訓練信号・評価基準を形作るテストデータ・安全性を担保するガードレールデータといった、AIのモデルの出力特性と性能を規定する要素です。そのため本ポジションでは、・どのデータがモデルの意思決定に影響するのか・どの評価が本番性能を適切に測定できるのか・どのようなデータ設計が安全性を担保するのかといった問いに対し、研究的視点と実装視点の両方から取り組むことが求められます。 ■ 主な役割・LLM / VLM / マルチモーダルモデル向けの学習データ設計・データ前処理・アノテーション方針の設計と改善・モデル評価指標の設計および評価結果の分析・学習 → 評価 → データ改善のフィードバックループ構築・モデル開発チームとの連携による性能改善・データ品質・バイアス・安全性に関する設計指針の確立 ■ 研究テーマとしての領域本ポジションでは、以下のような研究的テーマに取り組んでいただく想定です。データ設計領域・モデル性能を最大化するデータ分布設計・データカバレッジと一般化性能の関係・少量データ環境での効率的データ生成評価領域・モデルの実運用性能を反映する評価指標の設計・評価データセットの品質設計・自動評価と人手評価の統合設計 AI安全性領域・有害出力を抑制する訓練データ設計・バイアス・公平性に関するデータ分析・安全性評価データセット（ベンチマーク）の設計・データガバナンス・トレーサビリティ設計・SFT, RLHFによるモデルの性能向上 ■ 主軸（最も期待する領域）・AIモデル向けデータ設計・品質管理・モデル評価とデータ改善ループの設計・Pythonを用いたデータ処理・分析・データ視点からのモデル性能改善 ■ 扱う対象例・LLM / VLM 向けテキスト・画像・動画データ・物体検知・画像認識モデル向けデータ・アノテーションデータ・メタデータ・安全性評価用データセット ■ このポジションで得られるもの・AIモデル性能を左右するデータ設計の実務経験。・最新のLLM / VLM を実運用レベルで扱う希少な機会。・AIの安全性・信頼性に関わる最前線の課題に取り組む経験。・研究とプロダクト開発を横断したキャリア。

必須スキル

- 機械学習またはAI関連プロジェクトにおいて、データ前処理・分析・評価設計に関わった経験がある方。 - Pythonを用いたデータ処理・分析経験をお持ちの方。 - モデル性能に対して「データの観点から」改善に取り組んだ経験がある方。 - AIの品質・安全性・バイアス・評価指標といったテーマに関心をお持ちの方。

歓迎スキル

- LLM / VLM / 画像・動画モデルにおけるタスク特性を踏まえたデータ構成・粒度・ラベル設計の経験 - アノテーション業務における、ガイドライン設計、品質基準策定、レビュー、改善サイクル運用の経験 - 精度・再現率・F1・BLEU 等の指標を用いた評価結果の解釈・ボトルネック分析の経験 - 学習 → 評価 → 改善を意識したデータパイプラインやRLHF基盤構築のご経験 - Data-centric AI / MLOps といった考え方に基づき、モデルだけでなくデータ設計に価値を置いた開発に関心がある方 - 研究コミュニティでのアウトプットとして、学会等での論文発表／査読付き発表などの実績がある方 - 生成AI（LLM/AIエージェント等）を用いた開発経験があり、エージェント設計・ツール連携（Function calling等）・RAG/検索・マルチモーダル文書理解（VLM/OCR）・安全運用（ファクトチェック/ガードレール）・タスク特化ベンチマークによる継続評価のいずれかに知見／実装経験（または強い関心）がある方 - 強化学習を含む学習手法や、課題設定〜分析〜実装〜検証までのDSプロセス、および AI支援コーディングツールの活用・運用の経験 - Robotics・Physical AI領域におけるデータ作成（IL用データ収集・VLA学習用データの生成・評価設計等）の経験がある方

求める人物像

- LLM / VLM / マルチモーダルモデルに関する実務経験。 - 評価データセット設計・モデル評価指標設計の経験。 - データ品質管理やアノテーション設計の経験。 - AI安全性・公平性・バイアスに関する研究または実務経験。 - 論文実装・研究活動・学会発表などの経験。

応募概要

給与	応相談（経験等に応じて600万円～ 1500万円程度を想定）
勤務地	東京都千代田区岩本町 2-4-1 神田岩本町プラザビル504 ※ハイブリッド勤務（リモートと出社の併用） ※週3以上出社が必須となります。
雇用形態	正社員
勤務体系	勤務時間：フレックスタイム制（コアタイム：11:00〜15:00）休日・休暇：土日祝日、夏季休暇、年末年始休暇、慶弔休暇
福利厚生	◾️休日・休暇・年次有給休暇・土日祝日・夏季休暇・年末年始休暇・慶弔休暇・産前産後休暇・育児休暇・生理休暇 ◾️福利厚生・各種社会保険完備・交通費全額支給・健康診断・インフルエンザ予防接種・書籍購入費負担・カンファレンス参加費負担・社内勉強会・社内会食費用支援・1on1 ・フリードリンク・モニター貸与・自販機設置"

企業情報

企業名	株式会社APTO
設立年月	2020年1月20日
本社所在地	東京都千代田区岩本町２丁目４−１神田岩本町プラザビル504
従業員数	30名
企業サイトURL	https://apto.co.jp/