011号(2025/12/24)

目次

寄稿記事

巻頭言: スタートアップにおけるSREを考えてみる

書いた人:しょっさん( @syossan27

スタートアップの生存フェーズに応じて、SREはいつ・どのように効かせるべきかを考察します。

Enabling SREの意義をファイナンスの観点で考えてみる

書いた人:Aikawa( @yaml_villager

ファイナンスの観点からEnabling SREの意義を考察しています。

SREに必要なことはすべて、ランニングが教えてくれた

書いた人:@ohsawa0515( @ohsawa0515

SREとランニング(マラソン)の共通点を見出して、SREの原則をランニングに適用することを考察します。

国内外のSRE記事

In Conversation

GoogleのBen Treynor Sloss氏がインタビュアーであるNiall Murphy氏と対話形式でSREは何か、なぜ効果的なのか、従来の運用チームとどう異なるかについて語るインタビュー記事です。
SREの定義や背景として、ソフトウェアエンジニアの視点で運用を設計し自動化を重視する考え方が紹介されています。
この対談はSREの本質やチームでの役割理解に役立つ内容となっています。

Gemini 3 beaks OpenAI’s long-standing lead in SRE tasks.

AIを活用したインシデント管理およびオンコールプラットフォームを開発しているRootlyによる記事。
Gemini 3 ProがRootly AI LabsによるSRE向けベンチマークで、これまで優勢だったOpenAIモデルを上回る精度を示したことが紹介されています。
Gemini 3 ProはS3セキュリティ設定やIAM構成などのSREタスクで総合的に高いパフォーマンスを発揮し、平均約4%の優位性が確認されました。
SREにおける生成AI活用の最新動向とモデル選定の指標として役立つ内容になります。

LLMs won’t save us

先程の記事とは逆に、LLM非常に強力で有用な面があるものの、特にインシデント管理やSREの複雑で予測困難な業務において万能の解決策にはならないという批判的な視点が述べられている記事になります。
著者のNiall Murphyは、LLMが誤りや限界を持つ現状を踏まえつつ、人間が持つ専門知識や判断を完全に代替することはできないと指摘しています。
結論として、LLMは補助的な役割を果たす可能性はあるものの、「われわれを救う(すべての課題を解決する)」存在ではないという主張がされています。

Is your DR plan just wishful thinking? Prove your resilience with chaos engineering

災害復旧(DR)計画を単なる文書で終わらせず、カオスエンジニアリングによる実験で実際に計画の有効性を検証する方法が紹介されています。
カオスエンジニアリングを用いて、リージョン障害やコンポーネント停止といった想定災害を意図的に再現し、フェイルオーバーが計画どおりに実行されるか、復旧時間やデータ損失が目標を満たしているかを測定することで、DR計画の現実的な実行力を推し量ります。

Measuring AI-Driven Automation: The Metrics That Prove Whether Your Platform is Actually Getting Smarter

AIによる自動化が本当に「スマートに機能しているか?」を評価するために、単なる実行数ではなく質と影響を測る具体的な指標が必要だという主張が書かれている記事です。
取り上げられている主な指標には、AIが実際に対応したタスクの割合(自動化カバレッジ)、平均復旧時間の短縮、誤判断の少なさ(アクション品質)、および予測による未然防止やエンジニアの認知負荷の低減などが含まれます。
こうしたメトリクスを計測することにより、AIが単なる作業実行ツールとしてだけでなく実際に信頼性向上や効率化に寄与しているかを判断してみるのはいかがでしょうか?

まゆぞー、CREやめるってよ

SRE Kaigi 2025にもご登壇いただいた、まゆぞーさんがCREを辞められるという退職エントリーです。
SREを学ぶ中で「SREは振る舞い」という考え方を知り、CREも同じであるという気付きを得られているのが素晴らしいです。
CREはGoogleで生まれた概念ですが、原典にも「SREの原理や教訓をお客様に適用すると、CREにたどり着くのです。」と書かれており、その考え方を実体験を通じて言語化されている点に、長くCREとして取り組んできたからこその説得力を感じました。

信頼性がクリスマスプレゼント!? ~アポロ8号とSREの意外な関係~

1968年のアポロ8号ミッションにおけるソフトウェア開発者マーガレット・ハミルトンの取り組みを通じて、信頼性の本質と価値について語られています。
宇宙飛行ミッションという極限の状況での検証やエラーからの学びが、現代のSRE/ソフトウェア工学にも通じる教訓として紹介されています。
「信頼性をクリスマスプレゼントとして受け取る」という素敵な比喩を交えつつ、準備・ドキュメント化・失敗からの学習の重要性が述べられている点がグッドですね。