仕事概要
【会社概要】
ストックマーク株式会社は「価値創造の仕組みを再発明し、人類を前進させる」をミッションに掲げ、最先端の生成AI LLM技術を活用し、企業の変革を支援しています。
弊社の強みは、フルスクラッチで国産LLMを開発できる技術力です。2024年5月には、国内最大級となる1,000億パラメータの日本語特化LLM「Stockmark-2」を公開しました。
多くの企業が海外モデルの微調整やOSS活用にとどまる中、当社はゼロから自らの手でモデルを設計・構築。日本語とビジネス領域に最適化された性能は、国産最高クラスの水準を誇ります。さらに、ハルシネーションを大幅に抑えており、自社管理下で安全に運用可能です。
単なる“生成AIの利用企業”ではなく、“AIそのものを創る企業”として、日本の産業競争力を技術で支えていく存在となることを目指しています。
この技術力を活かして事業展開しており、現在はSaaS事業として製造業向けAIエージェント「Aconnect」、PaaS新規事業として業務AI実装支援プラットフォーム「SAT(Stockmark A Technology)」を運営しています。
創業時からエンタープライズ企業をターゲットとしており、すでに日経225の30%、300社を超える企業様での導入が進んでいます。今後は製造業のR&Dを起点に、国内のエンタープライズ企業はもちろん、日本企業全体そしてグローバル企業にも展開していく予定です。
2024年10月にはシリーズDにて45億円、累計88億円の資金調達を完了。
従業員も150名規模になり、更なる成長を目指すために人員を募集しております!
【現状の課題】
- 数億件規模のWeb上の文献をクローリング/コンテンツ抽出/配信するためのデータパイプラインを開発、運用する人材が不足している
- 自社プロダクトのAI Agent開発のためのデータ拡充の方針検討、要件定義、実装をプロダクトチームのPMやエンジニアとコミュニケーションしつつ自ら実行する人材が不足している
【業務内容】
当社は、ニュース・特許・論文・Web情報など、企業活動に関わる膨大な公開情報を収集・構造化し、最先端の生成AI技術を活用して、企業の意思決定や事業変革を支援する複数のプロダクトを提供しています。
本ポジションでは、これら全プロダクト共通の基盤となるデータ配信システムに位置づけられる、Webクローラーおよび文書配信パイプラインの設計・開発・運用を担っていただきます。プロダクト価値の根幹を支えるデータ基盤として、安定性・スケーラビリティ・拡張性を意識した開発が求められるポジションです。
エンジニアとして記載の課題解決のための開発を進めながら、データプラットフォームチームをリードし生産性の最大化を行うことも期待しています。
■具体的な業務内容
- TypeScript/Pythonを用いたWebニュース・特許・論文などを配信するデータプラットフォームの開発と運用
- サーバーレス環境による分散処理のスケーラビリティ向上と監視設計
※変更の範囲:開発関連業務
【チーム構成】
事業責任者(CEO)1名
開発責任者 1名
プロダクトエンジニア 7名
AI Agentエンジニア 6名
構造化エンジニア 3名
データエンジニア 3名
プロダクトマネージャー 1名
リサーチャー 1名
CS 2名
Biz 8名
【開発環境】
[開発言語]
データパイプライン: Python
Webクローラー: TypeScript(Node.js)
[コンテナ]
Docker
[IaC]
Terraform
[クラウド]
AWS
[ライブラリ]
Pyspark, Puppeteer
[AIツール]
Cursor, CodeRabbit, Devin
【ポジションの魅力】
全プロダクト共通の文書配信システムの開発・運用に携わることで、以下のような経験を積むことができます。
- 数億件規模の文書データを対象とした、サーバーレス環境における大規模分散処理の設計・開発・運用経験
- 数万サイトを対象としたWebクローラーの開発を通じて、Webフロントエンド・バックエンド双方の知見を活かしながら、不安定な外部環境を前提とした監視・運用設計のノウハウを習得
- PdMやCustomer Successチームと連携し、プロダクト要件や顧客課題を踏まえた新規開発・改善提案を主体的に行うことで、技術視点から事業にコミットする経験
【関連資料】
・Opendata チームまとめサイト
https://stockmark.wraptas.site/48e328c4d33a480f837a6509f575db8f
・世界中の情報を収集し、機械学習の力で届ける Opendata Unitのご紹介
https://note.com/stockmark/n/nebcfb9447683
必須スキル
※すべて必須
- エンジニア歴3年以上
- Python を用いたアプリケーション開発経験
- 要件定義から設計〜実装〜運用に至るまで一気通貫での経験
- 以下の経験1つ以上
・サーバーレスを用いたフルスタックな開発/運用及びそのリード経験(Lambda, ECS, Fargate, Step Functions など)
・データパイプライン・ETLの構築やワークフローエンジン、分散処理フレームワークを用いた開発/運用経験(Sparkなど)
歓迎スキル
- コンピュータサイエンスに関連する技術分野の修士号または博士号
- チーム開発をリードした経験
- 顧客向け自社開発サービスの開発、運用経験
- 文書検索や文書推薦を行うサービスの開発、運用経験
- サーバーレスに対する幅広い知見と業務経験
- Terraformを用いた開発/運用経験
求める人物像
- コンピュータサイエンス、分散処理が好き
- 最新の理論や事例をフォロー、検証するのが好き
- 与えられた課題だけでなく、自ら問いを立て、そのために必要な解決策を生み出せる
- ビジネスサイドとコミュニケーションしながら、いかにプロダクトに貢献できるかを考えられる
- 前向きなチャレンジ精神
<その他>
- 日本国内に居住可能な方
- 開発に関する技術的な内容含め、日本語で円滑にコミュニケーションが取れる方
目安:日常会話レベル
応募概要
| 給与 |
|
|---|---|
| 勤務地 | 【本社所在地】
【就業場所】
【リモートワークについて】
仙台・京都・大阪などからフルリモートで働いている人、ワーケーションを楽しみながら働いている人、母国に数週間帰国して働いている外国籍社員、また出社メインの人など多様な働き方を実現しています |
| 雇用形態 | 正社員 |
| 勤務体系 | 【就業時間】
リモートワークと合わせて、時間や場所に縛られない柔軟な働き方が可能です。 【休日休暇】
|
| 試用期間 | あり(3ヶ月) ※期間中の条件変更なし |
| 福利厚生 | 【保険】
【その他】
【教育・スキルアップ】
【社内コミュニケーション】
|
企業情報
| 企業名 | ストックマーク株式会社 |
|---|---|
| 設立年月 | 2016年11月 |
| 本社所在地 | 東京都港区南青山 1 丁目12-3 LIFORK MINAMI AOYAMA S209 |
| 事業内容 | 自然言語処理を活用した企業文化変革の支援を行うサービスの開発・運営 |
| 資本金 | 非公開 |
| 従業員数 | 143 |
| 企業サイトURL | https://stockmark.co.jp/ |