仕事概要
ポジションの概要
「ロボットを、人々から愛され、頼られる『人格』に変える」
LLM(大規模言語モデル)やマルチモーダルAIを駆使し、ugoが周囲の状況を理解し、人と自然にコミュニケーションをとるための「知能」と「振る舞い」を開発します。
駅構内や百貨店での多言語案内、オフィスでの来客対応など、ロボットが人と接する場面で、違和感のない自然なインタラクションを実現するための技術開発に取り組んでいただきます。
私たちと一緒に、業務DXロボットの開発を通じて、労働力不足の解決に挑戦しませんか?
具体的な仕事内容
LLMを活用した対話機能、音声認識・合成、社会的挙動(人を検知して道を譲る、適切な距離感を保つ等)、マルチモーダルフィードバック(LED、音声、ディスプレイ、動き)を組み合わせた、人に寄り添うロボットのインタラクション機能を開発します。
主な業務
- LLM(OpenAI API、Claude API等)を活用した対話・案内機能の開発
- 音声認識・音声合成システムの統合と最適化
- 多言語対応(日本語、英語、中国語等)の自然な対話システム構築
- 社会的挙動(Social Behavior)の実装:人の接近を検知して道を譲る、会釈をする、適切な距離感を保つ等
- マルチモーダルフィードバックの設計:LED、音声、ディスプレイ、ロボットの動きを組み合わせた直感的なUX
- 案内サイネージUI/UXの開発(Vue.js、TypeScript等)
- 人検知・トラッキングシステムとの連携
- コンテキストに応じた振る舞い切り替えロジックの実装
- フィールドテストおよび技術検証
- 開発プロセスの最適化(Git flowの導入や開発環境整備など)
- 他部門との技術調整、要件定義のサポート
開発環境
OS・インフラ
- OS:Linux (Ubuntu 22.04)
- インフラ:AWS
- その他:Docker, GitHub Actions, AWS Copilot CLI
使用言語・技術スタック
- 言語:Python
- AI/ML:LLM(OpenAI API等)、音声認識(Whisper等)、音声合成(TTS)
- UI/UX:マルチモーダルフィードバック(音声、LED、ディスプレイ、動き)
- 人検知:カメラ、LiDAR、距離センサー
開発ツール
- バージョン管理:Git (Git flow)
- コミュニケーション:Slack, Notion
- AI支援開発:Claude Code, Codex
このポジションの魅力
技術的な魅力
LLMとロボティクスの融合による新しい体験の創造
- 最新のLLM技術を実世界のロボットに統合し、人と自然に対話するシステムを構築
- 音声、視覚、動きを組み合わせたマルチモーダルなインタラクション設計
- 駅構内や百貨店など、実際の公共空間での案内業務という実用的なユースケース
- 社会的挙動(人を避ける、道を譲る等)の実装による、人に受け入れられるロボットの振る舞い設計
- 多言語対応により、訪日外国人への案内など、社会的な課題解決に直結
- 実機での検証機会が豊富で、実際のユーザーからのフィードバックを得ながら開発できる
組織・カルチャー
- 多様なバックグラウンドを持つエンジニアが国籍問わず在籍するグローバルな環境
- 幅広い専門性を持つエンジニアとともに、最先端のロボット開発に挑戦できる環境
- 得意分野を活かしながら、新しい領域にも挑戦し、スキルを磨ける機会が多くあります
- 国籍も年代も異なる様々なメンバーがフラットに意見を交わし合い、切磋琢磨できるカルチャー
キャリア・成長機会
- LLMとロボティクスを融合した最先端の技術領域でのスペシャリストに
- Human-Robot Interactionという、これから重要性が増す領域での専門性を構築
- 将来的には、新規ロボット機種のインタラクション設計全体をリード
- ゆくゆくは、新規ロボットの立ち上げにおけるソフトウェア開発にも関わるチャンスがあります
- フレックス勤務を活用し、働きやすい環境で技術革新に挑戦できます
参考情報
▼ コーポレートサイト
https://corp.ugo.plus/
▼ note
https://note.com/ugo_robot
▼ podcast <ugo Robotics Radio>
https://open.spotify.com/show/51DueB6zSlbVzVXnGehD9y?si=86eaa8dcf06a4471
応募時のお願い
・応募時の書類(履歴書・職務経歴書)はPDF形式にてご提出いただきますようお願い申し上げます
必須スキル
- Pythonを実務で使用した経験(目安:3年以上)
- Linuxの利用経験(目安:3年以上)
- LLM、音声認識、UI/UX設計のいずれかの実装経験
歓迎スキル
- 人とシステムのインタラクション設計の知見
- LLM(GPT、Claude等)を活用したアプリケーション開発経験
- 音声認識・音声合成システムの開発・統合経験
- 多言語対応システムの開発経験
- Vue.js、TypeScript、Rustを用いたフロントエンド開発経験
- 対話システム、チャットボットの開発経験
- 人検知・トラッキングアルゴリズムの実装経験
- マルチモーダルAI(視覚・言語・音声の統合)の開発経験
- センサーデータを活用したコンテキスト認識の実装経験
- UX/UIデザインの知見
- Webサービスとの連携開発経験
- 商用レベルのロバスト性を実現するための技術洗練スキル(製品化追込みスキル)
- Git flowワークフローなどを用いた開発経験
求める人物像
- フットワークが軽く幅広い事に興味をお持ちの方
- 新技術への興味をお持ちの方
- 課題に対して自ら仮説をたて具体的なアクションを実行し改善を継続して実施できる方
- エンジニア・ビジネス両面の視点を持ち、プロダクト価値向上に貢献できる方
応募概要
| 給与 | ■想定年収 |
|---|---|
| 勤務地 | 東京都千代田区東神田1-7-8 (本社) |
| 雇用形態 | 正社員 |
| 勤務体系 | 勤務時間(フレックスタイム制、コアタイム:有 11:00~16:00) |
| 試用期間 | あり(3ヶ月) |
| 福利厚生 | ●交通費支給 |
企業情報
| 企業名 | ugo株式会社 |
|---|---|
| 設立年月 | 2018年2月 |
| 本社所在地 | 東京都千代田区東神田1-7-8 プライム東神田ビル8F |
| 資本金 | 1億円(資本準備金含む) |
| 従業員数 | 85名 |
| 企業サイトURL | https://corp.ugo.plus/ |