仕事概要
【会社概要】
ストックマーク株式会社は「価値創造の仕組みを再発明し、人類を前進させる」をミッションに掲げ、最先端の生成AI LLM技術を活用し、企業の変革を支援しています。
弊社の強みは、フルスクラッチで国産LLMを開発できる技術力です。2024年5月には、国内最大級となる1,000億パラメータの日本語特化LLM「Stockmark-2」を公開しました。
多くの企業が海外モデルの微調整やOSS活用にとどまる中、当社はゼロから自らの手でモデルを設計・構築。日本語とビジネス領域に最適化された性能は、国産最高クラスの水準を誇ります。さらに、ハルシネーションを大幅に抑えており、自社管理下で安全に運用可能です。
単なる“生成AIの利用企業”ではなく、“AIそのものを創る企業”として、日本の産業競争力を技術で支えていく存在となることを目指しています。
この技術力を活かして事業展開しており、現在はSaaS事業として製造業向けAIエージェント「Aconnect」、PaaS新規事業として業務AI実装支援プラットフォーム「SAT(Stockmark A Technology)」を運営しています。
創業時からエンタープライズ企業をターゲットとしており、すでに日経225の30%、300社を超える企業様での導入が進んでいます。今後は製造業のR&Dを起点に、国内のエンタープライズ企業はもちろん、日本企業全体そしてグローバル企業にも展開していく予定です。
2024年10月にはシリーズDにて45億円、累計88億円の資金調達を完了。
従業員も150名規模になり、更なる成長を目指すために人員を募集しております!
【現状の課題】
2024年に立ち上げたLLM新規事業において、エンタープライズ企業が保有する膨大な「Excelドキュメント」の活用が急務となっています。しかし、Excel特有の複雑な仕様(セル結合、多段ヘッダ、視覚的なレイアウトなど)をLLMが解釈可能な形式に高精度に変換・構造化することは技術的難易度が高く、一般的なパーサーでは対応しきれません。
現在、この「Excel構造化」という重要かつ高難易度なテーマに専任で向き合い、仕様の深い理解に基づいたパージングロジックの実装と精度向上を担うエンジニアリソースが不足しています。
【業務内容】
LLMを用いた新規事業SaaSのバックエンドエンジニアとして、特にExcelファイルを中心としたドキュメント構造化エンジンの開発・実装をリードいただきます。
ML/データサイエンスの知見を活かしつつ、プロダクトレベルで堅牢なデータ処理パイプラインを構築するポジションです。
■具体的な業務内容
- Excel(Office Open XML等)の仕様を深く理解し、複雑な表構造を論理的に構造化するパージングロジックの開発
- 構造化データの精度評価環境の構築と、継続的なロジック改善
- Pythonを用いたバックエンドAPIおよびデータ処理パイプラインの実装・運用
- MLエンジニアやデータサイエンティストと連携した、RAG向けデータ生成プロセス
【チーム構成】
<PaaS Unit>
事業責任者(CEO)1名
開発責任者 1名
プロダクトエンジニア 7名
RAGエンジニア 5名
機械学習エンジニア 3名
プロダクトマネージャー 1名
リサーチャー 1名
CS 1名
Biz 3名
新規事業企画 5名
【開発環境】
[使用言語/フレームワーク]
Python、TypeScript、Vue.js 、Node.js
[コンテナ]
Docker
[IaC]
Terraform
[クラウド]
AWS, Azure
【ポジションの魅力】
- ファイル仕様の深淵に潜る、知的な技術挑戦:単なるライブラリ利用にとどまらず、Office Open XML等の仕様レベルまで掘り下げ「Deepな技術開発」に没頭できます。
- 「アカデミアでのML経験 × 実務での実装力」が活きる:数理的思考をビジネスレベルの堅牢なコードとして昇華させることができます。
- エンタープライズRAGの「ラストワンマイル」を解決する:既存のLLMでは活用しきれないExcelデータに対し、ソリューションを提供し企業のDXを推進できます。
【関連資料】
- Stockmark LLM特設LP
https://llm.stockmark.co.jp/ - 業務AIの実装支援プラットフォーム「 SAT 」
https://sat.stockmark.co.jp/ - 構造化データから自社ナレッジ活用を促進するAIエージェントの開発支援を開始 RAG実用化サービス「SAT」にエージェントショーケース機能をリリース
https://stockmark.co.jp/news/20250423 - 専門性の高い“暗黙知”を形式知化する生成AI基盤開発へ 製造業特化のマルチモーダルAI基盤を開発
https://stockmark.co.jp/news/20250715 - AI×SaaSのマストハブを作る、前人未到の挑戦。45億円の調達を達成したストックマークのその先。
https://note.com/stockmark/n/n8b54893cf532
必須スキル
※すべて必須
- 理工系大学院を修了、またはそれに準ずる数学・アルゴリズムの知識
- Pythonを用いたWebアプリケーションまたはデータ処理基盤のバックエンド開発経験(3年以上目安)
- 複雑なデータ構造を扱うロジックの実装経験
ex) 社内データや実験データを生成してデータとして扱えるようにした経験
歓迎スキル
- 大学・大学院時代に機械学習(ML)やデータサイエンスの研究・活用経験があること
- pandas, openpyxl などのライブラリを用いた高度なデータ処理経験
- Computer Vision(CV)の基礎知識(レイアウト解析の理解に役立ちます)
- データエンジニアとしてのETL処理の実装経験
- Office Open XML等のファイル仕様に関する深い知識
求める人物像
- ML/数理的なバックグラウンドを持ちつつ、職種としてはエンジニアリング(実装)にこだわりがある方
- 仕様が複雑なデータやドキュメントに対し、構造を紐解きハックすることに面白みを感じる方
- 研究開発的なタスクを、保守性の高いプロダクトコードに落とし込むことができる方
- ビジネスサイドと連携し、顧客価値につながるデータ構造化を追求できる方
応募概要
| 給与 |
|
|---|---|
| 勤務地 | 【本社所在地】
【就業場所】
【リモートワークについて】
仙台・京都・大阪などからフルリモートで働いている人、ワーケーションを楽しみながら働いている人、母国に数週間帰国して働いている外国籍社員、また出社メインの人など多様な働き方を実現しています |
| 雇用形態 | 正社員 |
| 勤務体系 | 【就業時間】
リモートワークと合わせて、時間や場所に縛られない柔軟な働き方が可能です。 【休日休暇】
|
| 試用期間 | あり(3ヶ月) ※期間中の条件変更なし |
| 福利厚生 | 【保険】
【その他】
【教育・スキルアップ】
【社内コミュニケーション】
|
企業情報
| 企業名 | ストックマーク株式会社 |
|---|---|
| 設立年月 | 2016年11月 |
| 本社所在地 | 東京都港区南青山 1 丁目12-3 LIFORK MINAMI AOYAMA S209 |
| 事業内容 | 自然言語処理を活用した企業文化変革の支援を行うサービスの開発・運営 |
| 資本金 | 非公開 |
| 従業員数 | 143 |
| 企業サイトURL | https://stockmark.co.jp/ |