ストックマーク株式会社 求人一覧1185【Dev】 AIエンジニア(ドキュメント構造化 / LLM新規事業)
ストックマーク株式会社 求人一覧

1185【Dev】 AIエンジニア(ドキュメント構造化 / LLM新規事業)

ストックマーク株式会社

仕事概要

【会社概要】

ストックマーク株式会社は「価値創造の仕組みを再発明し、人類を前進させる」をミッションに掲げ、最先端の生成AI LLM技術を活用し、企業の変革を支援しています。

弊社の強みは、フルスクラッチで国産LLMを開発できる技術力です。2024年5月には、国内最大級となる1,000億パラメータの日本語特化LLM「Stockmark-2」を公開しました。

多くの企業が海外モデルの微調整やOSS活用にとどまる中、当社はゼロから自らの手でモデルを設計・構築。日本語とビジネス領域に最適化された性能は、国産最高クラスの水準を誇ります。さらに、ハルシネーションを大幅に抑えており、自社管理下で安全に運用可能です。

単なる“生成AIの利用企業”ではなく、“AIそのものを創る企業”として、日本の産業競争力を技術で支えていく存在となることを目指しています。

この技術力を活かして事業展開しており、現在はSaaS事業として製造業向けAIエージェント「Aconnect」、PaaS新規事業として業務AI実装支援プラットフォーム「SAT(Stockmark A Technology)」を運営しています。

創業時からエンタープライズ企業をターゲットとしており、すでに日経225の30%、300社を超える企業様での導入が進んでいます。今後は製造業のR&Dを起点に、国内のエンタープライズ企業はもちろん、日本企業全体そしてグローバル企業にも展開していく予定です。

2024年10月にはシリーズDにて45億円、累計88億円の資金調達を完了。
従業員も150名規模になり、更なる成長を目指すために人員を募集しております!

【現状の課題】

2024年に立ち上げたLLM新規事業において、エンタープライズ企業が保有する膨大な「Excelドキュメント」の活用が急務となっています。しかし、Excel特有の複雑な仕様(セル結合、多段ヘッダ、視覚的なレイアウトなど)をLLMが解釈可能な形式に高精度に変換・構造化することは技術的難易度が高く、一般的なパーサーでは対応しきれません。

現在、この「Excel構造化」という重要かつ高難易度なテーマに専任で向き合い、仕様の深い理解に基づいたパージングロジックの実装と精度向上を担うエンジニアリソースが不足しています。

【業務内容】

LLMを用いた新規事業SaaSのバックエンドエンジニアとして、特にExcelファイルを中心としたドキュメント構造化エンジンの開発・実装をリードいただきます。

ML/データサイエンスの知見を活かしつつ、プロダクトレベルで堅牢なデータ処理パイプラインを構築するポジションです。

■具体的な業務内容

  • Excel(Office Open XML等)の仕様を深く理解し、複雑な表構造を論理的に構造化するパージングロジックの開発
  • 構造化データの精度評価環境の構築と、継続的なロジック改善
  • Pythonを用いたバックエンドAPIおよびデータ処理パイプラインの実装・運用
  • MLエンジニアやデータサイエンティストと連携した、RAG向けデータ生成プロセス

【チーム構成】

<PaaS Unit>
事業責任者(CEO)1名
開発責任者 1名
プロダクトエンジニア 7名
RAGエンジニア 5名
機械学習エンジニア 3名
プロダクトマネージャー 1名
リサーチャー 1名
CS 1名
Biz 3名
新規事業企画 5名

【開発環境】

[使用言語/フレームワーク]
Python、TypeScript、Vue.js 、Node.js
[コンテナ]
Docker
[IaC]
Terraform
[クラウド]
AWS, Azure

【ポジションの魅力】

  • ファイル仕様の深淵に潜る、知的な技術挑戦:単なるライブラリ利用にとどまらず、Office Open XML等の仕様レベルまで掘り下げ「Deepな技術開発」に没頭できます。
  • 「アカデミアでのML経験 × 実務での実装力」が活きる:数理的思考をビジネスレベルの堅牢なコードとして昇華させることができます。
  • エンタープライズRAGの「ラストワンマイル」を解決する:既存のLLMでは活用しきれないExcelデータに対し、ソリューションを提供し企業のDXを推進できます。

【関連資料】

必須スキル

※すべて必須

  • 理工系大学院を修了、またはそれに準ずる数学・アルゴリズムの知識
  • Pythonを用いたWebアプリケーションまたはデータ処理基盤のバックエンド開発経験(3年以上目安)
  • 複雑なデータ構造を扱うロジックの実装経験
    ex) 社内データや実験データを生成してデータとして扱えるようにした経験

歓迎スキル

  • 大学・大学院時代に機械学習(ML)やデータサイエンスの研究・活用経験があること
  • pandas, openpyxl などのライブラリを用いた高度なデータ処理経験
  • Computer Vision(CV)の基礎知識(レイアウト解析の理解に役立ちます)
  • データエンジニアとしてのETL処理の実装経験
  • Office Open XML等のファイル仕様に関する深い知識

求める人物像

  • ML/数理的なバックグラウンドを持ちつつ、職種としてはエンジニアリング(実装)にこだわりがある方
  • 仕様が複雑なデータやドキュメントに対し、構造を紐解きハックすることに面白みを感じる方
  • 研究開発的なタスクを、保守性の高いプロダクトコードに落とし込むことができる方
  • ビジネスサイドと連携し、顧客価値につながるデータ構造化を追求できる方

応募概要

給与
  • 想定年収
    7,008,000円〜11,004,000円 ※月給×12ヶ月

    月給
    584,000円〜917,000円
    <内訳>
    基本給:433,023円〜679,935円
    固定残業代45時間分:150,977円〜237,065円 ※超過分は別途支給
     

  • 昇給あり(年2回/5月、11月)

勤務地

【本社所在地】

  • 東京都港区南青山 1 丁目12-3 LIFORK MINAMI AOYAMA S209
     

【就業場所】

  • 本社または自宅その他リモートワークが行える場所(変更の範囲なし)
    ※フルリモートワーク可
     

【リモートワークについて】

  • 基本的にはフルリモート体制
    居住地は日本国内に限ります(海外に居住してのフルリモート不可)
  • 本社への出社について
    弊社の定める通勤圏(一都三県)居住者は、リモート/出社を回数制限なく自由に使い分けながら勤務可能です
    一都三県以外の居住者は、月1回業務とは関係なく自由に出社可能です

仙台・京都・大阪などからフルリモートで働いている人、ワーケーションを楽しみながら働いている人、母国に数週間帰国して働いている外国籍社員、また出社メインの人など多様な働き方を実現しています

雇用形態
勤務体系

【就業時間】

  • フレックスタイム制(コアタイム:10:00~14:00)
    1ヶ月の標準労働時間:1日8時間×営業日数
    ※時間外労働あり(月平均10〜20時間)

リモートワークと合わせて、時間や場所に縛られない柔軟な働き方が可能です。
勤務時間の調整や中抜けなどで、子育てや介護との両立もしやすい環境です。
 

【休日休暇】

  • 年間休日123日
  • 土日祝(完全週休2日制)
  • 年末年始休暇
  • 有給休暇(入社時付与 ※付与日数は入社月による)
  • 産前産後休暇
  • 育児休暇
試用期間
福利厚生

【保険】

  • 各種社会保険完備(関東ITソフトウェア健康保険組合加入)
       

【その他】

  • 通勤交通費(リモートのため実費支給)
  • 成長加速費(自己研鑽・AI活用に関する費用補助/年間24万円まで経費として申請可)
  • 定期健康診断
  • インフルエンザ予防接種
  • 希望のPC支給
  • オフィスにて水/コーヒー/炭酸/アルコールなどのドリンク無料提供
  • オフィスグリコ設置
  • 屋内禁煙(屋外喫煙所あり)
     

【教育・スキルアップ】

  • 入社後5日間のオンボーディングあり
  • 月1回の研究日制度(自身の技術向上・学習目的)
     

【社内コミュニケーション】

  • 週1回全社オンラインミーティング
  • 月1回懇親会(オフライン開催、一部オンライン有り)
  • 半期1回キックオフ(オンライン&オフラインのハイブリッド開催)

企業情報

企業名
設立年月
本社所在地
事業内容

自然言語処理を活用した企業文化変革の支援を行うサービスの開発・運営

資本金
従業員数
企業サイトURL