03. Software Engineer & Infrastructure Engineer の求人一覧 - Turing株式会社
3001_Principal Software Engineer
【チューリングについて】
チューリングのミッションは「We Overtake Tesla」です。
2021年の創業から累計60億円の支援を受け、人類のグランドチャレンジである完全自動運転の実現を目指しています。弊社が開発している自動運転システムは、End-to-Endの極めてシンプルな構成であり、世界を理解した生成AIが人間以上の運転能力を獲得することで完全自動運転を実現させるというものです。
最先端のAIと自動運転の境界を押し広げ、グローバル規模で影響力のある技術と製品を創造するために、最高なチームを作ります。
【ミッション】
経験豊富なソフトウェアエンジニアを募集しています。
完全自動運転AIモデルの開発には膨大なデータが必要です。カメラの映像のほか位置情報やLiDARの点群データなど、異なるセンサーから取得したデータが含まれます。
質の高いAIモデルを開発するためには、これらのデータを効率よく処理することやデータ同士の統合、機械学習に使いやすい状態になるよう事前処理を行うなど、高度なエンジニアリングが必要です。
次世代データ基盤を構築し、Platform Engineeringを推進するソフトウェアエンジニアを募集します。
【具体的な業務内容】
自動運転AIモデルの開発効率を上げることがミッションになります。業務内容は多岐にわたりますが、以下のようなものが含まれます。
・ペタバイト規模のデータを扱うデータ基盤の開発と運用
・学習データの作成、拡張、キュレーション(データ検索機能の実装、抽出ロジックの生成、オートラベリング、データ拡張など)
・アノテーションを効率的に行うための仕組みや、サービスの開発
・走行データ収集のための開発(経路生成、Planning、Navigation連携など)
・データの評価、評価システムの設計
・その他、AIモデル開発を支える社内向けサービスやSDKの開発
など
3002_Principal Software Engineer(分散学習・大規模データ)
チューリングはマルチモーダル生成AIで完全自動運転の実現を目指しているディープテックスタートアップです。
End-to-End自動運転モデルの開発にあたって、圧倒的な計算リソースの獲得と学習の効率を上げることMLOpsのサイクルを高速に回すことが肝要です。
本ポジションは、自動運転AIの学習・運用に不可欠な分散学習基盤と大規模データ処理システムの設計・開発・運用をリードしていただくプリンシパルレベルのソフトウェアエンジニアです。
特に、数百PB規模の走行データやセンサーデータを高速かつ効率的に処理・学習できるインフラの設計・構築を推進し、次世代のAI開発環境を最前線で創り上げていただきます。
【業務内容例】
・分散学習基盤の設計・開発・最適化
- AIモデルの大規模分散学習フレームワークの開発(PyTorch、TensorFlow、独自フレームワークの最適化)
- GPU/TPUクラスターのオーケストレーションと効率化(Slurm、Rayなど)
・大規模データ処理基盤の構築・運用
- 数百PB規模の走行・センサーデータを効率的に処理するデータパイプラインの設計・開発
- 高速データ処理・ストレージ最適化
・AI開発環境の最適化・自動化
- モデル学習からデプロイメントまでのMLパイプラインの自動化(MLflow、Airflowなど)
- CI/CDの導入とエンジニアリング生産性の向上
・チームの技術的リード・育成
- エンジニアチーム全体の技術的方向性の策定とリード
- 最新技術の調査・導入・技術戦略の推進
3003_Front-end Engineer(AIプラットフォーム開発)
チューリングはマルチモーダル生成AIで完全自動運転の実現を目指しているディープテックスタートアップです。自社でデータ収集から実車での制御までを一貫して開発しています。End to Endというデータの入力から出力の端から端までをAI一発で問題解決するアプローチをとっています。
データセントリックなAI開発においては、①データ収集、②データの取捨選択、③学習データセット作り、④完成したAIの検証の4サイクルを高速、かつ効果的に回していくことが重要です。
今回募集する職種では、このオペレーションを支えるAIプラットフォームの改善を通じて、上記オペレーションの高速化、効率化に責任を持っていただきます。
※AIプラットフォームとは、モデル開発を行う一連の開発プロセスを支える技術を表現しています。データ収集からデータセットの作成、モデルの評価・フィードバックのPDCAサイクルをよりスムーズかつ強力に推進するための技術基盤を開発しています。
【業務内容】
・AIプラットフォームの新機能開発・改善
- 収集した運転動画データの検索機能の開発
- データ収集ドライバーが利用する機能の改善
- AI検証ドライバーのテスト・レポート機能の実装
- 模範的運転を選別するための仕組み開発
3010_Senior Software Engineer,Data Platform(End-to-End自動運転モデル開発)
チューリングでは、車載カメラの映像を入力に車の制御を行う「End-to-End の自動運転MLモデル」の開発を行っています。
モデルの開発には Data-Centric AI と呼ばれるアプローチを取っていますが、実際に学習に用いるデータの裏側には膨大なデータが存在します。膨大なデータから必要な情報を効率よく探索するためには相応の仕組みが必要なため、次世代データ基盤を構築し Platform Engineeringを推進するソフトウェアエンジニアを募集します。
【業務内容】
・Data-Centric AI のための次世代データ基盤の構築、運用
・ツール利用など、機械学習エンジニアの認知負荷を下げるサポート(Enablement, Onboarding)
【SaaSやサービス開発とは異なる仕事の面白さ】
MLエンジニアがモデル開発を行うためにはML以外のソフトウェア実装がかなり必要です。例えばデータの前処理の自動化やそのプロセスの可視化サービス、データの偏りや状態の可視化ツールなどが必要でこれらはMachine learningよりもソフトウェア開発の知見が求められます。
われわれのデータ基盤には毎日数十TB近くのデータがアップロードされており、それらのデータを適切に処理し、管理しながら開発プロセスを回していく必要があります。膨大なデータ量を適切に捌き、MLOpsがしっかりと回るための仕組みや開発が非常に重要なのです。
強いMLエンジニアとソフトウェアが組むことで自動運転は実現していきます。これまでのソフトウェア開発経験を活かして人類のグランドチャレンジに一緒に挑みましょう。
【この仕事の特徴・面白さ】
大きく3つあります。
1.データ量が大きい
2.非構造データを扱うのが難しい(し、やりがいがある)
3.自動運転ML開発向けのAPIやツールが少ないのでゼロベースで課題解決できる
1.について
チューリングでは、1日に数TB〜数十TBのデータ量がアップロードされます。このデータを「きれいな状態で・ただしく」データベースに格納していかないといけません。
データ量が多くなればなるほど、データの整理や保存方法、検索方法など気にするポイントが増えますし、データを扱いやすくするための基盤づくりや仕組みづくりが大事になってきます。
2.について
チューリングでは、8つのカメラから取得した映像データ、Lidarのセンサーデータ、GNSSの位置情報データなどを組み合わせています。属性の異なるこれらのデータをひとまとめてにしてきれいにするのは大変です。
また、チューリングでは1つの大きなAIモデルの中に複数のモジュールやサブタスクが無数にあります。モジュールやサブタスクによっては必要なデータの量や形式が異なります。そのため、それぞれのモジュールやサブタスクの開発事情を考慮して非構造データを整理していく必要があります。
3.APIやツールが少ない
自動運転ML開発向けのツールやサービスは少ないです。そのため、非構造データを自分たちでデータを適切に前処理・可視化・状態確認・データ分布整理をするためのツールを開発していく必要があります。
この開発のプロセスにおいてはMLエンジニアの業務フローを可視化して、彼らの業務プロセスにおいて効率化できる部分を探したり、ボトムネックを特定して課題解決するなどの動きが必要になってきます。
3011_Senior Software Engineer,MLOps(End-to-End自動運転モデル開発)
チューリングでは、車載カメラの映像を入力に車の制御を行う「End-to-Endの自動運転MLモデル」の開発を行っています。
モデルの開発には Data-Centric AI と呼ばれるアプローチを取っていますが、継続的なデータおよびモデルの改善には高度なソフトウェアエンジニアリングやクラウドを活用した自動化が必要不可欠です。機械学習エンジニアと協力し、データやモデルの継続的な改善を行うソフトウェアエンジニアを募集します。
【業務内容】
・機械学習エンジニアと協力し、データやモデルの継続的な改善
・クラウド等を活用した処理の自動化や、内部ツール・サービスの実装
・システムアーキテクチャの設計
【SaaSやサービス開発とは異なる仕事の面白さ】
MLエンジニアがモデル開発を行うためにはML以外のソフトウェア実装がかなり必要です。例えばデータの前処理の自動化やそのプロセスの可視化サービス、データの偏りや状態の可視化ツールなどが必要でこれらはMachine learningよりもソフトウェア開発の知見が求められます。
われわれのデータ基盤には毎日数十TB近くのデータがアップロードされており、それらのデータを適切に処理し、管理しながら開発プロセスを回していく必要があります。膨大なデータ量を適切に捌き、MLOpsがしっかりと回るための仕組みや開発が非常に重要なのです。
強いMLエンジニアとソフトウェアが組むことで自動運転は実現していきます。これまでのソフトウェア開発経験を活かして人類のグランドチャレンジに一緒に挑みましょう。
【この仕事の特徴・面白さ】
大きく3つあります。
1.データ量が大きい
2.非構造データを扱うのが難しい(し、やりがいがある)
3.自動運転ML開発向けのAPIやツールが少ないのでゼロベースで課題解決できる
1.について
チューリングでは、1日に数TB〜数十TBのデータ量がアップロードされます。このデータを「きれいな状態で・ただしく」データベースに格納していかないといけません。
データ量が多くなればなるほど、データの整理や保存方法、検索方法など気にするポイントが増えますし、データを扱いやすくするための基盤づくりや仕組みづくりが大事になってきます。
2.について
チューリングでは、8つのカメラから取得した映像データ、Lidarのセンサーデータ、GNSSの位置情報データなどを組み合わせています。属性の異なるこれらのデータをひとまとめてにしてきれいにするのは大変です。
また、チューリングでは1つの大きなAIモデルの中に複数のモジュールやサブタスクが無数にあります。モジュールやサブタスクによっては必要なデータの量や形式が異なります。そのため、それぞれのモジュールやサブタスクの開発事情を考慮して非構造データを整理していく必要があります。
3.APIやツールが少ない
自動運転ML開発向けのツールやサービスは少ないです。そのため、非構造データを自分たちでデータを適切に前処理・可視化・状態確認・データ分布整理をするためのツールを開発していく必要があります。
この開発のプロセスにおいてはMLエンジニアの業務フローを可視化して、彼らの業務プロセスにおいて効率化できる部分を探したり、ボトムネックを特定して課題解決するなどの動きが必要になってきます。
3012_Computer Vision / 3D Reconstruction エンジニア(End-to-End自動運転モデル開発)
チューリングでは、車載カメラの映像を入力に車の制御を行う「End-to-Endの自動運転MLモデル」の開発を行っています。
モデルの開発には Data-Centric AI と呼ばれるアプローチを取っていますが、これには「高品質なデータセット」が必要不可欠です。
収集したデータに対するアノテーションを大規模にスケールさせる方法として機械学習を用いたオートラベリング技術の開発を行っています。
今回の求人では、コンピュータビジョンによる3次元再構成の知見や経験を活かし、高品質なデータセット作成・オートラベリングのモデル実装を支えてくれるエンジニアを募集します。
◼️業務内容
・データセット作成におけるオートラベリング技術の開発
・カメラ画像から、NeRF、Gaussian Splatting、COLMAPなどを用いて3次元空間を再構成する技術の開発
・カメラ画像とIMUなどのセンサーを組み合わせて高精度に自己位置推定を行うための技術開発
・カメラ画像とセンサーのキャリブレーションを行うための技術開発
3次元再構成したデータを元にベクターマップや3次元物体ラベルを生成するためのMLモデル、オートラベリングと呼ばれる走行データへのラベル付を自動化するモデルの開発に用いるためのデータづくりをメインミッションとしていただきます。MLモデルのためのデータづくりとなるため、機械学習の知見を持った方は大歓迎です(入社後のキャッチアップでもかまいません)
3013_Product Manager,Dataset(End-to-End自動運転モデル開発)
チューリングでは、車載カメラの映像を入力に車の制御を行う「End-to-Endの自動運転MLモデル」の開発を行っています。
モデルの開発には Data-Centric AI と呼ばれるアプローチを取っていますが、これには「高品質なデータセット」が必要不可欠です。一方でデータセットの作成やその元となる走行データの収集には多くのことを考慮する必要があります。キュレーションやアノテーション、オートラベリングなども要素として関わってくるため、機械学習の知見が必要不可欠です。機械学習エンジニアと連携して、実際にモデルの精度が改善したかまで追う必要もあります。
機械学習の知見を活かし、高品質なデータセット作成のためのロードマップを作成・推進するプロジェクトマネージャーを募集します。
※ 機械学習エンジニアとしての経験は必須となります。
【業務内容】
・データセットに関連するロードマップの策定
・膨大なデータから必要な箇所を抽出する仕組みやロジック(キュレーション)
・アノテーション、オートラベリング、データ収集車両の走行エリアなど
・データが高品質であることを確認するための監査およびフィルタリング方法の開発
・機械学習エンジニアと連携し、取り組んでいるタスク(モデル)の改善を検証するための評価手法の開発とテストを調整する。
・データ収集チーム、機械学習エンジニアとの緊密なフィードバックループを維持し、新しいデータセットが実際に自動運転を改善することを確認する。
【この仕事の特徴・面白さ】
大きく3つあります。
1.データ量が大きい
2.非構造データを扱うのが難しい(し、やりがいがある)
3.自動運転ML開発向けのAPIやツールが少ないのでゼロベースで課題解決できる
1.について
チューリングでは、1日に数TB〜数十TBのデータ量がアップロードされます。このデータを「きれいな状態で・ただしく」データベースに格納していかないといけません。
データ量が多くなればなるほど、データの整理や保存方法、検索方法など気にするポイントが増えますし、データを扱いやすくするための基盤づくりや仕組みづくりが大事になってきます。
2.について
チューリングでは、8つのカメラから取得した映像データ、Lidarのセンサーデータ、GNSSの位置情報データなどを組み合わせています。属性の異なるこれらのデータをひとまとめてにしてきれいにするのは大変です。
また、チューリングでは1つの大きなAIモデルの中に複数のモジュールやサブタスクが無数にあります。モジュールやサブタスクによっては必要なデータの量や形式が異なります。そのため、それぞれのモジュールやサブタスクの開発事情を考慮して非構造データを整理していく必要があります。
3.APIやツールが少ない
自動運転ML開発向けのツールやサービスは少ないです。そのため、非構造データを自分たちでデータを適切に前処理・可視化・状態確認・データ分布整理をするためのツールを開発していく必要があります。
この開発のプロセスにおいてはMLエンジニアの業務フローを可視化して、彼らの業務プロセスにおいて効率化できる部分を探したり、ボトムネックを特定して課題解決するなどの動きが必要になってきます。
3014_Software Engineer(車両運動制御)
チューリングはマルチモーダル生成AIで完全自動運転の実現を目指しているディープテックスタートアップです。
所属するE2Eチームは、完全自動運転を実現するAIモデルの開発を行っています。モデルを向上させるためにはデータ収集から実車へのデプロイまでのサイクルを高速に回すことが重要であり、ソフトウェアとハードウェアを行き来しながら開発を行う必要があります。
今回のポジションは車両全体の制御を実現するための募集です。
チューリングの自動運転技術で安定して車両を動かすために、AI技術やUIなどのソフトウェアレイヤーの要求を適切に理解し、各種ハードウェアのコントロールを担います。さまざまな機能を開発することはもちろんのこと、信頼性や保守性といった面でも高い性能を達成することがミッションとなります。
【具体的な仕事内容】
制御領域での業務は、コードベースでの開発がメインとなります。主な内容としては以下のとおりです。
・車両の運動制御システムの設計・実装
・車両の運動制御アルゴリズムの設計・実装
・実車両を用いた制御性能の評価・チューニング
・制御システムの信頼性・安全性の検証
【多くのレイヤーの知見を身につけながらエッジAI実現に挑む】
エッジAI実現のために側に落とし込むために、あらゆるソフトウェアイシューに取り組みます。モデルの知識・システムアーキテクチャー・デバイス領域のすべての知見を活用して完全自動運転AI実現に貢献してください。
※入社時に全てのレイヤーの知見が必要なわけではありません。各レイヤーの知見を身につけながら前人未到の完全自動運転AI開発に挑んでください。
3020_Software Engineer(生成AI・LLM)
チューリングはマルチモーダル生成AIで完全自動運転の実現を目指しているディープテックスタートアップです。
生成AIチームのミッションは、完全自動運転を実現するためのマルチモーダルモデルの開発・大規模GPUクラスタの構築と運用の開発です。
そのために、機械学習、ソフトウェア、組み込み、インフラなど幅広い専門性を持ったメンバーが一つのチームに集まっています。
◆ソフトウェアエンジニアの業務内容
・研究開発用のデータエンジニアリング
・研究開発用のソフトウェア・ツールの開発
・データベース設計
など
3021_Infrastructure・GPU Cluster Engineer(生成AI・LLM)
【募集背景】
チューリングは完全自動運転の実現を目指しているディープテックスタートアップです。
大規模なGPU計算環境を利用し、ビジョンベース自動運転のための深層学習モデルやレベル5自動運転に利用するマルチモーダル基盤モデル・世界モデルなどの研究開発を行っています。現在、インフラ基盤であるGPUクラスターを構築・運用していくインフラエンジニアを募集しています。機械学習エンジニアが計算タスクに集中できる環境を整備し、限られた計算資源を最適化することでチューリングの完全自動運転開発を最大化することがミッションです。
◆インフラ/GPUクラスタエンジニアの業務内容
・計算環境の物理設計や機器の選定機器の設計
・ネットワークの設計
・ストレージシステムの効率化・高速化
・クラスタリング技術の開発
・クラウド環境上での計算環境の整備/運用
◆具体的な業務内容
大規模GPU計算環境を使って完全自動運転の実現に向けたマルチモーダル基盤モデル・世界モデルを開発する。そのためのインフラの構築・運用などを主な業務とします。機械学習エンジニアにとって扱いやすい計算環境を構築してください。同時に、クラウド環境も積極的に活用しており、AWS/Azure/GCP上での計算環境も運用します。
今後、チューリングでは数年先を見据えた計算基盤の選定・設計・構築をしていく必要があります。来年末には次の世代の計算環境を作っていく予定です。2~3年周期でGPUクラスターを構築していくため、事業計画や投資計画などのビジネス/財務メンバーとコミュニケーションも実施していただきます。
【今のチューリングで働く魅力】
KaggleGrandMaster3名など非常に優秀な機械学習エンジニアが多く有する中で、ユーザーと非常に近い距離でコミュニケーションをとりながら計算基盤を最適化していくという経験はインフラエンジニアにおいても非常に大きく貴重な経験となると考えています。
3033_IoTワークショップエンジニア
チューリングでは、完全自動運転の実現を目指しています。
我々が開発している自動運転システムは「End-to-End方式」(以下、E2E自動運転)で、E2E自動運転の成功の鍵は、機械学習モデルと、それを支える高品質なデータにあります。
現在は、高品質なデータセットを作成し学習・検証するサイクルを何度も繰り返すことで、MLモデルの精度を向上させている最中で、市街地での実走行データをはじめ、多種多様な運転シーンのデータを学習することで、特定の条件に限定されない自動運転システムを実現します。
今回は、データ収集車に搭載される機器をはじめとしたIoT機器の保守・運用・開発支援を担う方を募集します。
【業務の概要】
主なミッションは、実際に運用される環境を踏まえた機器・資材の選定から発注、購買、部品管理、車への加工をしている担当者との情報連携です。それに加えて、実際にデータ収集車両を動かしてみて発生した不具合や初動対応、システムの運用・保守をお任せします。
【具体的な業務内容】
・データ収集に必要なセンサやコンピューティング機器の検収や動作確認
・運用中の機器のメンテナンスや運用改善
・機材トラブル発生時の初期対応および調査
・関連資材(機材、部品等)の購入/管理および在庫整理
・開発メンバーや車両運用メンバーとの連携
など
3034_Software Engineer(自動運転システム開発)
チューリングはマルチモーダル生成AIで完全自動運転の実現を目指しているディープテックスタートアップです。
所属するチームは自動運転AIモデル開発チーム(E2Eチーム)と車両チームの中間に位置しており、自動運転システムに関わるソフトウェアのうち、E2Eチームが担当しているAI以外の範囲すべてを行っています。
具体的には、独自の自動運転システムのソフトウェア開発や自社開発モデル用のデータ収集車両の開発・保守などです。
チューリングの自動運転技術で安定して車両を動かすために、AI技術やUIなどのソフトウェアレイヤーの要求を適切に理解し、各種ハードウェアのコントロールを担います。さまざまな機能を開発することはもちろんのこと、信頼性や保守性といった面でも高い性能を達成することがミッションとなります。
【具体的な業務内容】
・基盤ソフトウェアとなるセンサー類の制御
・システムとしての成立性の担保
・ソフトウェアリリースフローの管理開発(CICD)
・車載システムパフォーマンスの改善
・Linuxのアプリケーションの開発、OSの調整
・データ収集システムの保守・運用。不具合やバグの検証・再現・改修・適用
など
【End-to-End自動運転AIに適した自動運転OS・ミドルウェアを作っていく】
チューリングでは国内にまだレファレンスのない独自のアプローチで自動運転AI開発を進めています。AIモデルの入力に用いるカメラや制御する車両に合わせ、それらの仕様を鑑みた開発を行う必要があります。そのため、組み込みソフトウェアやミドルウェア開発の経験がある人を求めています。