03. Software Engineer & Infrastructure Engineer の求人一覧 - Turing株式会社
3001_Principal Software Engineer
【チューリングについて】
チューリングのミッションは「We Overtake Tesla」です。
2021年の創業から累計60億円の支援を受け、人類のグランドチャレンジである完全自動運転の実現を目指しています。弊社が開発している自動運転システムは、End-to-Endの極めてシンプルな構成であり、世界を理解した生成AIが人間以上の運転能力を獲得することで完全自動運転を実現させるというものです。
最先端のAIと自動運転の境界を押し広げ、グローバル規模で影響力のある技術と製品を創造するために、最高なチームを作ります。
【ミッション】
経験豊富なソフトウェアエンジニアを募集しています。
完全自動運転AIモデルの開発には膨大なデータが必要です。カメラの映像のほか位置情報やLiDARの点群データなど、異なるセンサーから取得したデータが含まれます。
質の高いAIモデルを開発するためには、これらのデータを効率よく処理することやデータ同士の統合、機械学習に使いやすい状態になるよう事前処理を行うなど、高度なエンジニアリングが必要です。
次世代データ基盤を構築し、Platform Engineeringを推進するソフトウェアエンジニアを募集します。
【具体的な業務内容】
自動運転AIモデルの開発効率を上げることがミッションになります。業務内容は多岐にわたりますが、以下のようなものが含まれます。
・ペタバイト規模のデータを扱うデータ基盤の開発と運用
・学習データの作成、拡張、キュレーション(データ検索機能の実装、抽出ロジックの生成、オートラベリング、データ拡張など)
・アノテーションを効率的に行うための仕組みや、サービスの開発
・走行データ収集のための開発(経路生成、Planning、Navigation連携など)
・データの評価、評価システムの設計
・その他、AIモデル開発を支える社内向けサービスやSDKの開発
など
3010_Senior Software Engineer,Data Platform(End-to-End自動運転モデル開発)
チューリングでは、車載カメラの映像を入力に車の制御を行う「End-to-End の自動運転MLモデル」の開発を行っています。
モデルの開発には Data-Centric AI と呼ばれるアプローチを取っていますが、実際に学習に用いるデータの裏側には膨大なデータが存在します。膨大なデータから必要な情報を効率よく探索するためには相応の仕組みが必要なため、次世代データ基盤を構築し Platform Engineeringを推進するソフトウェアエンジニアを募集します。
【業務内容】
・Data-Centric AI のための次世代データ基盤の構築、運用
・ツール利用など、機械学習エンジニアの認知負荷を下げるサポート(Enablement, Onboarding)
【SaaSやサービス開発とは異なる仕事の面白さ】
MLエンジニアがモデル開発を行うためにはML以外のソフトウェア実装がかなり必要です。例えばデータの前処理の自動化やそのプロセスの可視化サービス、データの偏りや状態の可視化ツールなどが必要でこれらはMachine learningよりもソフトウェア開発の知見が求められます。
われわれのデータ基盤には毎日数十TB近くのデータがアップロードされており、それらのデータを適切に処理し、管理しながら開発プロセスを回していく必要があります。膨大なデータ量を適切に捌き、MLOpsがしっかりと回るための仕組みや開発が非常に重要なのです。
強いMLエンジニアとソフトウェアが組むことで自動運転は実現していきます。これまでのソフトウェア開発経験を活かして人類のグランドチャレンジに一緒に挑みましょう。
【この仕事の特徴・面白さ】
大きく3つあります。
1.データ量が大きい
2.非構造データを扱うのが難しい(し、やりがいがある)
3.自動運転ML開発向けのAPIやツールが少ないのでゼロベースで課題解決できる
1.について
チューリングでは、1日に数TB〜数十TBのデータ量がアップロードされます。このデータを「きれいな状態で・ただしく」データベースに格納していかないといけません。
データ量が多くなればなるほど、データの整理や保存方法、検索方法など気にするポイントが増えますし、データを扱いやすくするための基盤づくりや仕組みづくりが大事になってきます。
2.について
チューリングでは、8つのカメラから取得した映像データ、Lidarのセンサーデータ、GNSSの位置情報データなどを組み合わせています。属性の異なるこれらのデータをひとまとめてにしてきれいにするのは大変です。
また、チューリングでは1つの大きなAIモデルの中に複数のモジュールやサブタスクが無数にあります。モジュールやサブタスクによっては必要なデータの量や形式が異なります。そのため、それぞれのモジュールやサブタスクの開発事情を考慮して非構造データを整理していく必要があります。
3.APIやツールが少ない
自動運転ML開発向けのツールやサービスは少ないです。そのため、非構造データを自分たちでデータを適切に前処理・可視化・状態確認・データ分布整理をするためのツールを開発していく必要があります。
この開発のプロセスにおいてはMLエンジニアの業務フローを可視化して、彼らの業務プロセスにおいて効率化できる部分を探したり、ボトムネックを特定して課題解決するなどの動きが必要になってきます。
3011_Senior Software Engineer,MLOps(End-to-End自動運転モデル開発)
チューリングでは、車載カメラの映像を入力に車の制御を行う「End-to-Endの自動運転MLモデル」の開発を行っています。
モデルの開発には Data-Centric AI と呼ばれるアプローチを取っていますが、継続的なデータおよびモデルの改善には高度なソフトウェアエンジニアリングやクラウドを活用した自動化が必要不可欠です。機械学習エンジニアと協力し、データやモデルの継続的な改善を行うソフトウェアエンジニアを募集します。
【業務内容】
・機械学習エンジニアと協力し、データやモデルの継続的な改善
・クラウド等を活用した処理の自動化や、内部ツール・サービスの実装
・システムアーキテクチャの設計
【SaaSやサービス開発とは異なる仕事の面白さ】
MLエンジニアがモデル開発を行うためにはML以外のソフトウェア実装がかなり必要です。例えばデータの前処理の自動化やそのプロセスの可視化サービス、データの偏りや状態の可視化ツールなどが必要でこれらはMachine learningよりもソフトウェア開発の知見が求められます。
われわれのデータ基盤には毎日数十TB近くのデータがアップロードされており、それらのデータを適切に処理し、管理しながら開発プロセスを回していく必要があります。膨大なデータ量を適切に捌き、MLOpsがしっかりと回るための仕組みや開発が非常に重要なのです。
強いMLエンジニアとソフトウェアが組むことで自動運転は実現していきます。これまでのソフトウェア開発経験を活かして人類のグランドチャレンジに一緒に挑みましょう。
【この仕事の特徴・面白さ】
大きく3つあります。
1.データ量が大きい
2.非構造データを扱うのが難しい(し、やりがいがある)
3.自動運転ML開発向けのAPIやツールが少ないのでゼロベースで課題解決できる
1.について
チューリングでは、1日に数TB〜数十TBのデータ量がアップロードされます。このデータを「きれいな状態で・ただしく」データベースに格納していかないといけません。
データ量が多くなればなるほど、データの整理や保存方法、検索方法など気にするポイントが増えますし、データを扱いやすくするための基盤づくりや仕組みづくりが大事になってきます。
2.について
チューリングでは、8つのカメラから取得した映像データ、Lidarのセンサーデータ、GNSSの位置情報データなどを組み合わせています。属性の異なるこれらのデータをひとまとめてにしてきれいにするのは大変です。
また、チューリングでは1つの大きなAIモデルの中に複数のモジュールやサブタスクが無数にあります。モジュールやサブタスクによっては必要なデータの量や形式が異なります。そのため、それぞれのモジュールやサブタスクの開発事情を考慮して非構造データを整理していく必要があります。
3.APIやツールが少ない
自動運転ML開発向けのツールやサービスは少ないです。そのため、非構造データを自分たちでデータを適切に前処理・可視化・状態確認・データ分布整理をするためのツールを開発していく必要があります。
この開発のプロセスにおいてはMLエンジニアの業務フローを可視化して、彼らの業務プロセスにおいて効率化できる部分を探したり、ボトムネックを特定して課題解決するなどの動きが必要になってきます。
3012_Computer Vision / 3D Reconstruction エンジニア(End-to-End自動運転モデル開発)
チューリングでは、車載カメラの映像を入力に車の制御を行う「End-to-Endの自動運転MLモデル」の開発を行っています。
モデルの開発には Data-Centric AI と呼ばれるアプローチを取っていますが、これには「高品質なデータセット」が必要不可欠です。
収集したデータに対するアノテーションを大規模にスケールさせる方法として機械学習を用いたオートラベリング技術の開発を行っています。
今回の求人では、コンピュータビジョンによる3次元再構成の知見や経験を活かし、高品質なデータセット作成・オートラベリングのモデル実装を支えてくれるエンジニアを募集します。
◼️業務内容
・データセット作成におけるオートラベリング技術の開発
・カメラ画像から、NeRF、Gaussian Splatting、COLMAPなどを用いて3次元空間を再構成する技術の開発
・カメラ画像とIMUなどのセンサーを組み合わせて高精度に自己位置推定を行うための技術開発
・カメラ画像とセンサーのキャリブレーションを行うための技術開発
3次元再構成したデータを元にベクターマップや3次元物体ラベルを生成するためのMLモデル、オートラベリングと呼ばれる走行データへのラベル付を自動化するモデルの開発に用いるためのデータづくりをメインミッションとしていただきます。MLモデルのためのデータづくりとなるため、機械学習の知見を持った方は大歓迎です(入社後のキャッチアップでもかまいません)
3013_Product Manager,Dataset(End-to-End自動運転モデル開発)
チューリングでは、車載カメラの映像を入力に車の制御を行う「End-to-Endの自動運転MLモデル」の開発を行っています。
モデルの開発には Data-Centric AI と呼ばれるアプローチを取っていますが、これには「高品質なデータセット」が必要不可欠です。一方でデータセットの作成やその元となる走行データの収集には多くのことを考慮する必要があります。キュレーションやアノテーション、オートラベリングなども要素として関わってくるため、機械学習の知見が必要不可欠です。機械学習エンジニアと連携して、実際にモデルの精度が改善したかまで追う必要もあります。
機械学習の知見を活かし、高品質なデータセット作成のためのロードマップを作成・推進するプロジェクトマネージャーを募集します。
※ 機械学習エンジニアとしての経験は必須となります。
【業務内容】
・データセットに関連するロードマップの策定
・膨大なデータから必要な箇所を抽出する仕組みやロジック(キュレーション)
・アノテーション、オートラベリング、データ収集車両の走行エリアなど
・データが高品質であることを確認するための監査およびフィルタリング方法の開発
・機械学習エンジニアと連携し、取り組んでいるタスク(モデル)の改善を検証するための評価手法の開発とテストを調整する。
・データ収集チーム、機械学習エンジニアとの緊密なフィードバックループを維持し、新しいデータセットが実際に自動運転を改善することを確認する。
【この仕事の特徴・面白さ】
大きく3つあります。
1.データ量が大きい
2.非構造データを扱うのが難しい(し、やりがいがある)
3.自動運転ML開発向けのAPIやツールが少ないのでゼロベースで課題解決できる
1.について
チューリングでは、1日に数TB〜数十TBのデータ量がアップロードされます。このデータを「きれいな状態で・ただしく」データベースに格納していかないといけません。
データ量が多くなればなるほど、データの整理や保存方法、検索方法など気にするポイントが増えますし、データを扱いやすくするための基盤づくりや仕組みづくりが大事になってきます。
2.について
チューリングでは、8つのカメラから取得した映像データ、Lidarのセンサーデータ、GNSSの位置情報データなどを組み合わせています。属性の異なるこれらのデータをひとまとめてにしてきれいにするのは大変です。
また、チューリングでは1つの大きなAIモデルの中に複数のモジュールやサブタスクが無数にあります。モジュールやサブタスクによっては必要なデータの量や形式が異なります。そのため、それぞれのモジュールやサブタスクの開発事情を考慮して非構造データを整理していく必要があります。
3.APIやツールが少ない
自動運転ML開発向けのツールやサービスは少ないです。そのため、非構造データを自分たちでデータを適切に前処理・可視化・状態確認・データ分布整理をするためのツールを開発していく必要があります。
この開発のプロセスにおいてはMLエンジニアの業務フローを可視化して、彼らの業務プロセスにおいて効率化できる部分を探したり、ボトムネックを特定して課題解決するなどの動きが必要になってきます。
3020_Software Engineer(生成AI・LLM)
チューリングはマルチモーダル生成AIで完全自動運転の実現を目指しているディープテックスタートアップです。
生成AIチームのミッションは、完全自動運転を実現するためのマルチモーダルモデルの開発・大規模GPUクラスタの構築と運用の開発です。
そのために、機械学習、ソフトウェア、組み込み、インフラなど幅広い専門性を持ったメンバーが一つのチームに集まっています。
◆ソフトウェアエンジニアの業務内容
・研究開発用のデータエンジニアリング
・研究開発用のソフトウェア・ツールの開発
・データベース設計
など
3021_Infrastructure・GPU Cluster Engineer(生成AI・LLM)
【募集背景】
チューリングは完全自動運転の実現を目指しているディープテックスタートアップです。
大規模なGPU計算環境を利用し、ビジョンベース自動運転のための深層学習モデルやレベル5自動運転に利用するマルチモーダル基盤モデル・世界モデルなどの研究開発を行っています。現在、インフラ基盤であるGPUクラスターを構築・運用していくインフラエンジニアを募集しています。機械学習エンジニアが計算タスクに集中できる環境を整備し、限られた計算資源を最適化することでチューリングの完全自動運転開発を最大化することがミッションです。
◆インフラ/GPUクラスタエンジニアの業務内容
・計算環境の物理設計や機器の選定機器の設計
・ネットワークの設計
・ストレージシステムの効率化・高速化
・クラスタリング技術の開発
・クラウド環境上での計算環境の整備/運用
◆具体的な業務内容
大規模GPU計算環境を使って完全自動運転の実現に向けたマルチモーダル基盤モデル・世界モデルを開発する。そのためのインフラの構築・運用などを主な業務とします。機械学習エンジニアにとって扱いやすい計算環境を構築してください。同時に、クラウド環境も積極的に活用しており、AWS/Azure/GCP上での計算環境も運用します。
今後、チューリングでは数年先を見据えた計算基盤の選定・設計・構築をしていく必要があります。来年末には次の世代の計算環境を作っていく予定です。2~3年周期でGPUクラスターを構築していくため、事業計画や投資計画などのビジネス/財務メンバーとコミュニケーションも実施していただきます。
【今のチューリングで働く魅力】
KaggleGrandMaster3名など非常に優秀な機械学習エンジニアが多く有する中で、ユーザーと非常に近い距離でコミュニケーションをとりながら計算基盤を最適化していくという経験はインフラエンジニアにおいても非常に大きく貴重な経験となると考えています。
3030_AI Edge Deployment Engineer(自動運転システム開発)
チューリングはマルチモーダル生成AIで完全自動運転の実現を目指しているディープテックスタートアップです。
所属するEdgeComputerチームは自動運転AIモデル開発チーム(E2Eチーム)と車両チームの中間に位置しており、自動運転システムに関わるソフトウェアのうち、E2Eチームが担当しているAI以外の範囲すべてを行っています。
具体的には、独自の自動運転システムのソフトウェア開発や専用デバイスの開発、自社開発モデル用のデータ収集車両の開発・保守などです。
チューリングの自動運転技術で安定して車両を動かすために、AI技術やUIなどのソフトウェアレイヤーの要求を適切に理解し、各種ハードウェアのコントロールを担います。さまざまな機能を開発することはもちろんのこと、信頼性や保守性といった面でも高い性能を達成することがミッションとなります。
◆業務のミッション
End-to-End自動運転モデルによる推論の実現に責任を持ちます。ハードウェアとコンパイラ、機械学習モデル構築の技術と知見のすべてを駆使し、計算資源の限られる車載環境内での安定した推論実行を実現することが求められます。
◾️業務内容
・自動運転向けSoCへの実装と最適化
・自動運転モデル全体の高速化
・PyTorchで学習されたモデルのonnxへの変換とオペレータの実装
・現状のモデルのボトルネック分析と最適化
・車載システムで動作させるための適切なモデル構築と学習方法の選定
3031_Software Engineer(自動運転システム開発)
チューリングはマルチモーダル生成AIで完全自動運転の実現を目指しているディープテックスタートアップです。
所属するEdgeComputerチームは自動運転AIモデル開発チーム(E2Eチーム)と車両チームの中間に位置しており、自動運転システムに関わるソフトウェアのうち、E2Eチームが担当しているAI以外の範囲すべてを行っています。
具体的には、独自の自動運転システムのソフトウェア開発や専用デバイスの開発、自社開発モデル用のデータ収集車両の開発・保守などです。
チューリングの自動運転技術で安定して車両を動かすために、AI技術やUIなどのソフトウェアレイヤーの要求を適切に理解し、各種ハードウェアのコントロールを担います。さまざまな機能を開発することはもちろんのこと、信頼性や保守性といった面でも高い性能を達成することがミッションとなります。
【具体的な仕事内容】
自動運転システムの領域での業務は、Linux関連の開発がメインとなります。主な内容としては以下のとおりです。
・自動運転システム用のLinuxアプリケーション開発
・自動運転向けに最適化されたLinux OSの開発
・実車両を用いたデバッグや挙動の解析
【多くのレイヤーの知見を身につけながらエッジAI実現に挑む】
エッジAI実現のために側に落とし込むために、あらゆるソフトウェアイシューに取り組みます。モデルの知識・システムアーキテクチャー・デバイス領域のすべての知見を活用して完全自動運転AI実現に貢献してください。
※入社時に全てのレイヤーの知見が必要なわけではありません。各レイヤーの知見を身につけながら前人未到の完全自動運転AI開発に挑んでください。
3032_Software Engineer(エッジアプリケーション開発)
チューリングはマルチモーダル生成AIで完全自動運転の実現を目指しているディープテックスタートアップです。
所属するEdgeComputerチームは自動運転AIモデル開発チーム(E2Eチーム)と車両チームの中間に位置しており、自動運転システムに関わるソフトウェアのうち、E2Eチームが担当しているAI以外の範囲すべてを行っています。
具体的には、独自の自動運転システムのソフトウェア開発や専用デバイスの開発、自社開発モデル用のデータ収集車両の開発・保守などです。
チューリングの自動運転技術で安定して車両を動かすために、AI技術やUIなどのソフトウェアレイヤーの要求を適切に理解し、各種ハードウェアのコントロールを担います。さまざまな機能を開発することはもちろんのこと、信頼性や保守性といった面でも高い性能を達成することがミッションとなります。
【具体的な仕事内容】
エッジアプリケーションの領域での業務は、Linux関連の開発がメインとなります。主な内容としては以下のとおりです。
・自動運転システムやデータ収集に関連したLinuxアプリケーション開発
・カメラやGNSS、LiDARといった各種デバイスとの通信や制御
・データ収集を実施している車両上のアプリケーションの保守および運用
・実車両を用いたデバッグや挙動の解析
【国内で最も質の高いデータセットを構築していく】
完全自動運転実現のために、国内で最も質の高いデータセットをつくります。MLエンジニア・ソフトウェアエンジニアや、ハードウェア・デバイス、あらゆる領域のエンジニアと協力し、できる限りの手段をとってデータ取得・課題解決をしていってください。あなたの構築したデータセットが完全自動運転の礎になります。