仕事概要
会社について
Third Intelligenceは、日本発のAGIの確立に挑戦する、AI研究・プロダクト開発企業です。Third Intelligenceが独自に提唱する「遍在型AGI(汎用人工知能)」の確立と個人に寄り添ったその成長を通じて、社会の新たな基盤となるサービスの実現を目指します。
Third Intelligence Company Deck(別タブで開きます)
私たちは、2つの事業を展開しています。
1つは、日本発の汎用人工知能(AGI)の実現。従来のような巨大なモデルを全利用者に一律に提供するのではなく、利用者に合わせて独自に成長する「遍在型AGI」の実現を目指しています。
もう1つは、遍在型AGIの特性を活かした生活者向けグローバルプロダクトの構築です。2026年1月に国内最大規模の100億円規模の初回資金調達を完了し、博報堂DYグループとの資本業務提携を経て、研究開発並びにプロダクト開発を加速しています。
ポジションについて
ポジションの意義・背景
遍在型AGIを人間にとって身近な存在にするには、テキストだけでなく、声のトーンや周囲の状況をリアルタイムで理解し、人間らしく応答する能力が必要です。このポジションでは、最も直感的なインターフェースである「音声」を中心に据えた知覚・理解能力の開発に取り組んでいただきます。
業務内容・期待成果
- ユーザーとの自然なやり取りを実現するための、低遅延なEnd-to-Endの音声対話パイプラインの構築
- 音声情報と言語情報を高度に融合させ、音声のコンテキスト(話者の感情、周囲の環境音等)を深く理解するシステムの開発
- 将来的な視覚情報の統合を見据えた、マルチモーダルな表現学習(Embedding)の最適化および検証
- (将来的には、音声信号をテキストに変換せず直接理解し、感情やニュアンスを含めた応答を生成するネイティブ音声モデルの研究開発もお任せしていく可能性があります)
必須スキル
- 音声対話領域でのAIシステムのEnd-to-End構築経験
- Python, PyTorch, Distributed Training Frameworks (DeepSpeed, FSDPなど) の深い知識
- 音声信号処理、音声認識(ASR)、または音声合成(TTS)などの関連分野における深い専門性と研究・開発経験
- 最新の音声・マルチモーダル関連の論文(Speech-to-Speech, Audio-LLM等)を理解し、自律的に実装・検証できる能力
歓迎スキル
- フロンティアモデルの開発・運用実績
- 英語による技術議論およびグローバルな開発体制における業務経験
- 国際的な技術コミュニティでの活動や、英語による高度な技術交渉およびドキュメンテーション能力
- BigTech水準のHPCインフラストラクチャを、最高のパフォーマンスで利用するための最適化能力
- C++/CUDAなどの低レイヤー言語を用いた計算グラフ最適化、またはAIアクセラレータ(ASIC など)に関する専門的な知識
- 大規模言語モデル(LLM)と音声モデルを統合したアーキテクチャの開発経験
- リアルタイム性が要求されるシステムにおける推論エンジンの最適化や低遅延化の実装経験
応募概要
| 給与 | 応相談 |
|---|---|
| 勤務地 | 101-0052 東京都千代田区神田小川町1丁目4 WORK VILLA MYJ KANDA 11F 地方からフルリモートOK。 |
| 雇用形態 | 正社員 |
| 勤務体系 |
|
| 試用期間 | 3ヶ月 |
| 福利厚生 | For Productivity
For Growth
For Communication
For Life Plan
For Family
|
企業情報
| 企業名 | 株式会社Third Intelligence |
|---|---|
| 本社所在地 | 東京都千代田区神田小川町1丁目4 WORK VILLA MYJ KANDA 11F |
| 事業内容 | Third Intelligenceは、日本発のAGIの確立に挑戦する、AI研究・プロダクト開発企業です。Third Intelligenceが独自に提唱する「遍在型AGI(汎用人工知能)」の確立と個人に寄り添ったその成長を通じて、社会の新たな基盤となるサービスの実現を目指します。 Third Intelligence Company Deck(別タブで開きます) 私たちは、2つの事業を展開しています。 |