仕事概要
【募集背景】
株式会社TORIHADAでは、クリエイター向けWebサービス「FANME」および関連システムを運営しています。
機能開発のリードタイムを短縮する環境整備(例:プレビュー環境)、可用性の高いECS基盤の設計・運用改善、Datadog等を用いたオブザーバビリティの強化を主軸に、継続的な改善を推進しています。
これらを設計から実装、運用改善まで横断してリードしていただくSite Reliability Engineerを募集します。
特定領域の運用担当に閉じず、プロダクトと並走しながら基盤の改善を前に進める役割です。
* 技術選定や設計の段階から関与し、要件に対して最適な設計・改善を主導できます
* 数千RPS規模のトラフィックを前提に、可用性/性能/コストのバランス設計と運用改善に取り組めます
共に「意思ある個人による新しい経済をつくる」ことを目指し、感動を生み出すプラットフォームを作っていける方とぜひお話ししたいです!
【業務領域】
このポジションでは、日々の運用を“回す”だけでなく、運用が継続的にスケール取り組む領域は以下です。
・IaCを前提とした基盤の標準化・変更管理の整備(Terraform)
IaCで管理されていない既存リソースの整理・移行を進め、設計の標準化(モジュール/権限/命名/タグ等)やガードレール整備を行います。変更がレビュー可能で再現性のある形で進むよう、ワークフローも含めて整えます。
・機能開発をアクセラレートするためのインフラ環境整備
開発のリードタイム短縮につながる環境(例:プレビュー環境)の設計・構築・運用を推進します。安全性とスピードを両立するための自動化を進めます。
・ECS基盤の信頼性向上(設計・構築・運用改善)
可用性、スケーリング、デプロイ戦略、ネットワーク/セキュリティまで含めて、ECS基盤を継続的に改善します。
・オブザーバビリティ強化とインシデント対応力の向上
Datadog等を用いた監視/検知/可視化を改善し、障害の早期検知と迅速な復旧につながる運用を整えます。必要に応じてSLA/SLO等の指標設計も行い、改善が継続する形に接続します。
・SRE領域の継続改善(セキュリティ/キャパ/DR/コスト)
セキュリティリスクマネジメント、キャパシティプランニング、災害復旧計画(DR)と定期訓練、リソース最適化によるコスト最適化を、基盤運用に組み込みます。
【技術環境】
* AWS(主要)
* Google Cloud(一部)
* ECS(一部EKS) ※EKSから移行中
* Terraform
* GitHub Actions
* Datadog
* GitHub Projects
* Slack
必須スキル
* Site Reliability Engineer(SRE)またはインフラエンジニアとしての実務経験
* Webシステムのインフラ設計・構築・運用経験
* コンテナ実行環境を用いた設計・構築・運用経験
* ネットワーキングとセキュリティの知見
* 自走してプロジェクトを回し切る力
歓迎スキル
* AWS / GCP等のパブリッククラウドでの構築・運用経験
* Terraform等を用いたInfrastructure as Codeの実践知見
* コスト最適化戦略の立案と実施の知見
* システムの信頼性に関わる数値(SLA/SLOなど)の指標策定の知見
応募概要
| 給与 | 年収700万円〜 |
|---|---|
| 勤務地 | 原則フルリモート (関東圏内) 社内イベント等で出社をお願いする場合があります。 オフィス所在地:東京都渋谷区道玄坂2-25-12 道玄坂通 6F |
| 雇用形態 | 正社員 |
| 勤務体系 | 裁量労働 目安 (10:00〜19:00) |
| 試用期間 | 3カ月 ※試用期間中は契約社員となり、待遇や福利厚生に変更はありません。 |
| 福利厚生 | * 一人10万円までのAI予算があり、スピーディなAI導入が可能 * フルリモート環境、育児・病院での途中抜けなど、融通の利きやすい環境 ・社用デバイス貸与 ・書籍購入リクエスト制度 完全週休2日制 夏季休暇(7月~9月の期間内に3日間取得可能) 年末年始休暇(12/29~1/3) 慶弔休暇 産前産後休暇 育児休暇 ファミリーホリデー(自身の誕生日+一親等2名分の誕生日に休暇取得可能) F休(生理休暇) 有給休暇 |
企業情報
| 企業名 | 株式会社TORIHADA |
|---|---|
| 設立年月 | 2017年10月2日 |
| 本社所在地 | 〒150-0043 東京都渋谷区道玄坂2丁目25−12道玄坂通6F |
| 従業員数 | 150名 |