📗〔讀書心得〕- SRE Ch4:SLI、SLO 與 SLA 的實踐指南

解析《SRE》第四章,從 SLI、SLO 到 SLA 的定義與應用,探討如何量化服務可靠性、設定正確指標並善用錯誤預算,讓工程決策有數據支持。

📗〔讀書心得〕- SRE Ch3:擁抱風險與錯誤預算實務

解析《SRE》第三章「擁抱風險」,從 Error Budget 設計、可用性衡量方式到服務風險容忍度評估,理解 SRE 如何在可靠性與創新速度之間找到最佳平衡。

📗〔讀書心得〕- SRE Ch2:Google 生產環境與 Borg 架構解析

深入解析《SRE》第二章,涵蓋 Google 資料中心 Borg 叢集管理、Colossus/Bigtable/Spanner 儲存架構、gRPC 通訊、Monorepo 開發環境,及 N+2 冗餘規劃實務。

📗〔讀書心得〕- SRE Ch1:Google 如何用軟體工程思維打造可靠系統

解析《Site Reliability Engineering》第一章,從傳統 Sysadmin 到 Google SRE 的思維轉變,探討錯誤預算、50% 運維上限、監控原則與應急處理,理解如何平衡系統穩定性與功能發布速度。