Data Engineer(データエンジニア)
仕事概要
当社の概要
元クックパッド(2005-2015)副社長兼COOが代表を務めるAI SaaSスタートアップです。20億件以上という圧倒的な不動産ビッグデータと高度なAIアルゴリズムを武器に、賃貸物件の最適な家賃算出やレポート作成を一瞬で完結させるSaaS「スマサテ」を提供しています。業界トップクラスのシェア(管理戸数ランキングTOP200社の過半数が導入)と、解約率0.5%という驚異的な顧客満足度を誇り、既に盤石な収益基盤を確立しています。
現在は、この強固な顧客基盤をテコに、3つの新製品を同時開発する「マルチプロダクト戦略」を推進しています。単一製品の安定成長から、複数製品の展開による「非連続で爆発的な成長」へとフェーズが変わる、極めて面白いタイミングです。 また、短期的な株価や評価に縛られず、「顧客とプロダクトに本質的に向き合い続ける」ためにあえて上場を目指さない成長戦略を選択しています。
主な業務内容
▼お任せしたいこと|AI SaaSの心臓部を支えるデータエンジニア
スマサテのプロダクトの心臓部である「データ基盤」の開発・運用を担うポジションです。世の中に散らばる膨大かつ雑多な不動産情報を収集し、誰もが使える「綺麗なデータ」へとクレンジング・構造化していくのがメインミッションです。データサイエンティストの高度な分析や、アプリケーションの高速処理に耐えうる「綺麗で構造化されたデータ」へと継続的に変換・蓄積するため、スケーラブルなデータパイプラインの設計・運用をリードしていただきます。
▼具体的には....
• データ基盤(DWHやデータレイク等)のアーキテクチャの選定、設計、構築
• Web上からの継続的な不動産データ収集(クローリングやスクレイピング)、クレンジングおよび整形プログラムの実装
• バッチ処理やストリーミング処理のデータパイプラインの構築と最適化
• データ品質の担保、インフラ基盤やパイプラインの監視、パフォーマンスチューニング
• アプリチームやデータサイエンティストとの要件定義、データスキーマのすり合わせ
開発スタイル
- 難易度やメンバーのスキルに応じて、タスクをアサイン
- そのメンバーが主体的に設計・開発・テストまでを行ってプルリクエストまで担当
- 他メンバーがレビュー・動作確認を経てリリース
が基本的な流れになります。
まだ若い会社ですが、次のような文化・スタイルが醸成されてきています。
• 品質第一:リリース前に複数人でテスト。バグ発生時は全員で初動対応します。
• 高速サイクル:週2,3回アップデートをリリースできる体制を構築。
開発環境
• 開発言語:Ruby, PHP, Python, JavaScript, Node.js, TypeScript
• フレームワーク:Ruby on Rails, Django, React, Vue.js
• OS:Linux
• DB:MySQL8.x , BigQuery
• インフラ:AWS, GCP
• テスト: Autify, RSpec, Vitest
• CI/CD: CircleCI
• ソースコード管理:GitHub
• ローカル開発環境:Docker
最近の技術的取り組み事例
• Autifyを使用してテストの自動化
• AWSCloudWatchを導入し、監視を強化
• ElasticSearchとKibanaでのデータ分析、ログ監視
• Reactを導入することで開発速度を向上
• AwsAmplifyを導入することでスケーラビリティを向上
今後計画している技術的取り組み事例
• 現在のモノリシックアーキテクチャーからマイクロサービス化を推進
• Refineを導入することで開発プロセスを改善
• CI/CDパイプラインを構築して、開発とデプロイの効率を高める
• TypeScriptベースのReact/Next.jsへの完全な移行
本ポジションの魅力とやりがい
• 【技術基盤への投資】勤務時間の20%を技術的負債の解消や新しい技術の導入に割く制度があり、エンジニア主導で継続的な改善に取り組めます。
• 【ビッグデータとスケーラビリティ】11億レコードを超える膨大な不動産データを扱うマルチDB環境や、マイクロサービス化など、スタートアップならではの技術的チャレンジにあふれています。
• 【エンジニア本位のカルチャー】好きなPC(Mac/Windows/Linuxやスペックも選択可)、エディタ、AIツールを柔軟に導入でき、コアタイムなしのフルフレックスで圧倒的に働きやすい環境です。
• 【顧客志向と手触り感】セールスやPdMとの距離が非常に近く、ユーザーからの生のフィードバックをダイレクトに受け取りながら、本当に価値のあるプロダクト開発にこだわれます。
• 不動産という誰もが関わる巨大な基幹産業の課題をテクノロジーで解決していく、知的好奇心が尽きない面白さがあります。
キャリアパス例(ご希望や実績に応じて様々なパスがあります)
• Lead Data Engineer(リードデータエンジニア): スケーラブルなデータパイプラインのアーキテクチャ設計から技術選定までを主導し、データエンジニアリングチームを牽引するエキスパート。
• Data Architect(データアーキテクト): 組織全体のデータ戦略に基づき、11億件超のデータ基盤の統合やデータメッシュ設計、ガバナンス構築を全社横断で主導するポジション。
参考情報
必須スキル
• Pythonを用いたデータパイプライン(ETL/ELT)またはデータ処理バッチの開発経験(3年以上)
• AWSやGCP等クラウドインフラを利用したデータ基盤(DWH、データレイク等)の構築・運用経験
• SQLを用いた複雑なデータ抽出・集計の実務経験
• RDBMSおよびNoSQLデータベースの設計・運用経験
歓迎スキル
• 大規模データ(数億〜10億レコード超)を扱う処理基盤の最適化経験
• 大規模なWebクローラー/スクレイピングシステムの構築・運用経験
• dbt/Airflow等のオーケストレーションツールを用いた開発・運用経験
• BIツール(Tableau、Metabase等)のデータマート構築・運用経験
• Elasticsearch等を用いた検索システムの構築・チューニング経験
• 生成AI×データ活用の経験(RAG/LLM連携等)
• マイクロサービス化・データメッシュ設計の経験
• データセキュリティやガバナンスに関する知見
• 不動産・金融領域のデータ業務経験
求める人物像
• 「綺麗なデータ」を作ることに誇りを持ち、細部の品質にこだわれる方
• データサイエンティストやアプリエンジニアと連携し、チームのアウトプットを最大化することに喜びを感じる方
• レガシーなデータを扱う泥臭い作業もいとわず、技術力でスマートに解決できる方
• ユーザーの気持ちを考え誠実に対応できる方
• 仕事の期限を意識しつつアジャイルな柔軟性もある方
• TRY&ERRORでくじけない方
応募概要
| 給与 | グレード1: 400〜600万円 |
|---|---|
| 勤務地 | 【オフィス】 ● JR山手線目黒駅徒歩2分 |
| 雇用形態 | 正社員 |
| 勤務体系 | 【勤務時間】 【勤務形態】 【休日・休暇】 |
| 試用期間 | あり(3か月) |
| 福利厚生 | ● 社会保険完備(健康保険、厚生年金、雇用保険、労災保険) 【環境への投資】 |
企業情報
| 企業名 | スマサテ株式会社 |
|---|---|
| 設立年月 | 2015年7月17日 |
| 本社所在地 | 東京都品川区上大崎3-3-1 自転車総合ビル 8F |
| 事業内容 | AI賃料査定システムの開発 |
| 資本金 | 10,000,000円 |
| 従業員数 | 32名 |
| 企業サイトURL | https://sumasate.jp/ |