本記事では、SRE(サイトリライアビリティエンジニアリング)について学べるおすすめの参考書を紹介しています。
気になった参考書があれば、購入する前にAmazonの無料試し読みで内容を確認することをおすすめします。
表紙がイラストをたくさん使っているから、内容も初心者向けだろうと思い購入してみたら、図解での説明が少なく文字で埋め尽くされている参考書だった。。なんてこともありますので。
Amazon Kindle Unlimited
Amazon Kindle Unlimitedに登録すると、月額980円で読み放題だからオススメだよ!
初回30日間は無料だから、まだ登録したことのない人はぜひ試してみてね!
変数名/関数名にもう悩まない!
- 美しいコードが書けるが自然と書けるようになる
- 他の開発者が理解しやすいコードになる
SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム
出版社 | オライリージャパン |
著者 | 澤田 武男 / 関根 達夫 / 細川 一茂 / 矢吹 大輔 |
発売日 | 2017/8/12 |
ページ数 | 590ページ |
- SREの観点から見た Googleのプロダクション環境
- リスクの受容
- サービスレベル目標
- トイルの撲滅
- 分散システムのモニタリング
- Googleにおける自動化の進化
- リリースエンジニアリング
- 単純さ
- 時系列データからの実践的なアラート
- オンコール対応
- 効果的なトラブルシューティング
- 緊急対応
- インシデント管理
- ポストモーテムの文化:失敗からの学び
- サービス障害の追跡
- 信頼性のためのテスト
- SREにおけるソフトウェアエンジニアリング
- フロントエンドにおけるロードバランシング
- データセンターでのロードバランシング
- 過負荷への対応
- カスケード障害への対応
- クリティカルな状態の管理 :信頼性のための分散合意
- cronによる分散定期スケジューリング
- データ処理のパイプライン
- データの完全性:What You Read Is What You Wrote
- 大規模なプロダクトのローンチにおける信頼性
- SREの成長を加速する方法:新人からオンコール担当
- 割り込みへの対処
- SREの投入による運用過負荷からのリカバリ
- SREにおけるコミュニケーションとコラボレーション
- 進化する SREのエンゲージメントモデル
- 他の業界からの教訓
開発者と運用者の違いからgoolgeで実際に行われているものを紹介してくれる内容になっている。
引用元:Amazon
もちろんそのまま利用することは課題がでるが、知識の引き出しの一つとしたりその現場に合わせた形に変形させて利用したりすることができる「実用的な内容」となっている。
要は人の手を介さないでシステムを作りましょう。という話がメイン。
引用元:Amazon
Google規模で実現している事がすごく、そのノウハウが詰まっててすごく参考になる。
特にエラーバジェットの考え方は参考になった
SRE サイトリライアビリティエンジニアリングが”ザックリ”「すっきり」分かる本: Googleが実践している新DevOps方法論
著者 | GGtop.jp |
発売日 | 2022/1/26 |
ページ数 | 94ページ |
- なぜSREという考え方が生まれたのか
- SREを理解するための用語解説
- どのようにSREを導入すればいいのか~SLI、SLO、SLA設定例
- SLOを達成するために必要な開発環境とは
- SREに必要となる開発環境を理解するための用語解説
- インシデントが発生したら
- サイトリライアビリティエンジニア(SREng)に必要とされるスキルとは
まだITに足を踏み入れた私ですが、SREなどの記事など拝見いたしましたが、今回購入した一冊は初心者の私でも分かりやすく大切なポイントをおさえこの一冊でSREが身近に感じ今後のSREに携わって行きたいと考えました。
引用元:Amazon
SREを今から考えて行きたいなど、会社などでSRE投入を考えてる方は購入すべき価値のある一冊だと感じました。
最前線で活躍するエンジニアが経験談を交え分かり易く説明しているので、エンジニアの方には勿論、IT関連だけでなくすべてのビジネスに関わる人が、ビジネスを支えるITインフラの進化を楽しめる内容。
引用元:Amazon
SREの探求 ―様々な企業におけるサイトリライアビリティエンジニアリングの導入と実践
出版社 | オライリージャパン |
著者 | 山口 能迪 |
発売日 | 2021/9/3 |
ページ数 | 632ページ |
- SREにおけるコンテキストとコントロール
- サイトリライアビリティエンジニアの面接
- なるほど、SREチームを作りたいのですね
- インシデントのメトリクスを用いたSREの大規模な改善
- サードパーティとの協力を円滑に進める重要性
- 専任SREチームなしでSREの原則を適用する方法
- SREのいないSRE:Spotifyのケーススタディ
- 大企業におけるSREの導入
- 25ページでシステム管理者からSREへ
- 大企業でSRE導入の道を開く方法
- DevOpsの幅広い実践現場で活用されているSREのパターン
- DevOpsとSRE:コミュニティからの声
- Facebookにおけるプロダクションエンジニアリング
- 初めにカオスありき
- 信頼性とプライバシーが交わるところ
- データベースリライアビリティエンジニアリング
- データ耐久性のエンジニアリング
- SREのための機械学習入門
- ドキュメント作成業務の改善:エンジニアリングワークフローへのドキュメンテーションの統合
- アクティブなティーチングとラーニング
- サービスレベル目標の技法と科学
- 成功の文化としてのSRE
- SREのアンチパターン
- イミュータブルなインフラストラクチャとSRE
- スクリプタブルロードバランサー
- サービスメッシュはマイクロサービスの世話人か
- SREにおける心理的安全性
- SREの認知的作業
- 燃え尽きを超えて
- オンコール反対論
- 複雑なシステムのためのエレジー
- 運用と社会運動が交わるところ