仕事概要
【会社概要】
ストックマーク株式会社は「価値創造の仕組みを再発明し、人類を前進させる」をミッションに掲げ、自然言語処理及びAI技術を活用し、新しい価値創出にフォーカスできる環境を生み出すことを目指しています。
業務に直結する情報をAIが届けることにより、組織の情報感度を高め、事業アイディアの着想と組織内での発展を促す「Anews(エーニュース)」、AIが組織や業務に合わせて必要な情報を構造化し、示唆が得られる市場調査サービス「Astrategy(エーストラテジー)」という2つのSaaSプロダクトを提供し、企業の新たな価値創造をサポートしています。
現在のメインターゲットは国内大手の製造業R&Dであり、すでに日経225の30%を超える企業様での導入が進んでいます。今後は製造業のR&Dを起点に、国内のエンタープライズ企業、そして日本企業全体、さらにはグローバル企業にも展開していく予定です。
2022年8月にシリーズCで11億の資金調達完了。
2024年2月には、経済産業省およびNEDOが推進する「GENIAC(Generative AI Accelerator Challenge)プロジェクト」に採択され、
1000億パラメーターの自社LLM開発に着手し始めました!
従業員も100名規模になり、更なる成長を目指すために人員を募集しております!
【現状の課題】
・クローリングしたWebニュースのHTML/PDFから自動抽出したコンテンツにノイズや抽出不足が多く、検索やレコメンデーションのPrecision/Recallを下げる要因となっている。
・PDFやスライド形式の資料から主題や結論に関する記述を的確に抽出することができない。
・内容が同一のニュースを自動判定する精度が十分ではなく、同一のニュースが顧客に配信されてしまう。
・ビジネスと関係の薄いエンタメなどの記事を自動判定しきれず顧客に配信されてしまう。
・日本語LLM作成のためのノイズの少ない日本語文書が不足している
【ミッション】
世界中のビジネスデータから顧客に最適な情報を配信するために、自社プロダクトのコンテンツ配信基盤の技術検証及び製品開発を担っていただきます。
・自社プロダクトのコンテンツ配信基盤における、機械学習を用いた検証、実装の主体的な推進
・機械学習を用いたプロダクト改善企画の立案
【業務内容】
・自然言語処理や画像処理を用いた、HTML/PDF/パワーポイント等の多種ドキュメントに対するコンテンツ抽出エンジンのアルゴリズム検証と製品パイプライン開発
・言語モデルを用いた、顧客配信用ニューステキストに対するクレンジング処理の精度向上
・顧客配信用コンテンツに対する同一記事判定やカテゴリー判定の精度向上によるPrecision/Recallの向上
・FaaS/CaaSを用いた機械学習モジュールの分散処理パフォーマンスチューニングと監視設計
・数万件規模のWebサイトを対象としたWebクローラーの異常検知及び自動復旧機構の検証と実装
・日本語LLMの学習データとなるクレンジング済みコーパスの作成
※変更の範囲:開発関連業務
【開発環境】
[組織体制]
Opendata Team(8名)
内訳:Manager1名、サーバーサイドエンジニア2名、データエンジニア1名、機械学習エンジニア2名、MLOps1名、Data Reliability Engineer1名
[開発言語]
Python
[コンテナ]
Docker
[クラウド]
AWS (必要に応じてAzure, GoogleCloud)
[クラウド]
AWS, GCP
【ポジションの魅力】
・顧客利用データ分析ではなく、実世界に存在するビジネスコンテンツを素材として、汎用的なデータ収集と構造化(Web2text)による価値創出に共に挑戦することができる
・これから本格開発するデータプラットフォーム構築に初期から携わることができる
・FaaSによる大規模データ収集分散処理、機械学習パイプラインの開発/運用を経験できる
・プロダクトチームやカスタマーサクセスと連携し、データで価値を創造するための企画/開発を行うことができる
・Webコンテンツ抽出エンジンの検証を通したリサーチ業務に携わることができる
【関連資料】
Opendata Unitのご紹介
https://stockmark.wraptas.site/48e328c4d33a480f837a6509f575db8f
記事:世界中の情報を収集し、機械学習の力で整理、抽出して届ける!LLMや社内文書など挑戦し続けるOpendata Unitのご紹介
https://note.com/stockmark/n/nebcfb9447683
記事中のノイズ削除方式 - ChatGPTとの比較
https://tech.stockmark.co.jp/blog/noise_reduction/
必須スキル
※すべて必須
・理工系大学院を修了
・機械学習を扱うエンジニアまたはリサーチャー経験3年以上
・Pythonを用いたアプリケーション開発経験
歓迎スキル
・コンピュータサイエンスに関連する技術分野の修士号または博士号
・顧客向け自社サービスにおける機械学習を用いた開発/運用経験
・自然言語処理やテキスト解析を扱う業務経験または研究実績
・クラウドサービスを用いた機械学習パイプラインの実装経験
・リーダーなどの立場で事業背景を理解し自ら短期施策を立案/実行した経験
求める人物像
・コンピュータサイエンス、分散処理が好き
・最新の理論や事例をフォロー、検証するのが好き
・与えられた課題だけでなく、自ら問いを立て、そのために必要な解決策を生み出せる
・ビジネスサイドとコミュニケーションしながら、いかにプロダクトに貢献できるかを考えられる
・前向きなチャレンジ精神
<その他>
・日本国内に居住可能な方
・開発に関する技術的な内容含め、日本語で円滑にコミュニケーション可能な方
目安:日常会話レベル
応募概要
給与 | ■想定年収 7,298,000円〜12,794,000円 ※月給×12ヶ月+リモートワーク準備一時金(入社時支給)5万円 ■月給(手当含む):604,000円〜1,062,000円 <内訳> 基本給:433,023円〜772,620円 固定残業代45時間分:150,977円〜269,380円 ※超過分は別途支給 顧客と向き合う手当:2万円 ■昇給あり(年2回/5月、11月) |
---|---|
勤務地 | 【本社所在地】 ■東京都港区南青山 1 丁目12-3 LIFORK MINAMI AOYAMA S209 【就業場所】 ■本社または自宅その他リモートワークが行える場所(変更の範囲なし) ※フルリモートワーク可 【リモートワークについて】 ■基本的にはフルリモート体制 居住地は日本国内に限ります(海外に居住してのフルリモート不可) ■リモート/出社自由選択(出社回数規定/制限なし) それぞれの事情に合わせて使い分けながら勤務しています。 仙台・京都・大阪などからフルリモートで働いている人、ワーケーションを楽しみながら働いている人、母国に数週間帰国して働いている外国籍社員、また出社メインの人など多様な働き方を実現しています。 |
雇用形態 | 正社員 |
勤務体系 | 【就業時間】 ■フレックスタイム制 ■コアタイム:10:00~14:00 ■1ヶ月の標準労働時間:1日8時間×営業日数 ※時間外労働あり(平均10〜20時間) ・リモートワークと合わせて、時間や場所に縛られない柔軟な働き方が可能です。 ・勤務時間の調整や中抜けなどで、子育てや介護との両立もしやすい環境です。 【休日休暇】 ■年間休日123日 ■土日祝(完全週休2日制) ■年末年始休暇 ■有給休暇(入社時付与 ※付与日数は入社月による) ■産前産後休暇 ■育児休暇 |
試用期間 | あり(3ヶ月) ※期間中の条件変更なし |
福利厚生 | 【保険】 ■各種社会保険完備(関東ITソフトウェア健康保険組合加入) 【諸手当】 ■通勤交通費(リモートのため実費支給) ■顧客と向き合う手当(毎月一律2万円 ※月給に含む) 自己研鑽や顧客価値向上のために自由に利用可能 (書籍購入/セミナー受講/備品購入等) ■リモートワーク準備一時金(初回給与にて一律5万円) リモートワークを行うための準備に要する費用として支給 【その他】 ■定期健康診断(全額会社負担) ■インフルエンザ予防接種 ■希望のPC支給 ■オフィスにて水/コーヒー/炭酸/アルコールなどのドリンク無料提供 ■オフィスグリコ設置 ■屋内禁煙(屋外喫煙所あり) 【教育・スキルアップ】 ■入社後5日間のオンボーディングあり ■月1回の研究日制度(自身の技術向上・学習目的) 【社内コミュニケーション】 ■週1回全社オンラインミーティング ■月1回懇親会(オフライン開催、一部オンライン有り) ■半期1回キックオフ(オンライン&オフラインのハイブリッド開催) |
企業情報
企業名 | ストックマーク株式会社 |
---|---|
設立年月 | 2016年11月 |
本社所在地 | 東京都港区南青山 1 丁目12-3 LIFORK MINAMI AOYAMA S209 |
資本金 | 非公開 |
従業員数 | 100 |