附錄概要#

本附錄整理本書出現過的核心術語、縮寫、指標與工具,幫助讀者快速回溯。

原書最後附有英文索引(Index)。本附錄則以主題分類重新整理,讓讀者更容易循線回到正文。

縮寫對照#

  • SRE:Site Reliability Engineering(網站可靠性工程)
  • SDLC:Software Development Lifecycle(軟體開發生命週期)
  • SLA:Service Level Agreement(服務等級協議)
  • SLO:Service Level Objective(服務等級目標)
  • SLI:Service Level Indicator(服務等級指標)
  • MTTR:Mean Time To Recovery(平均修復時間)
  • MTBF:Mean Time Between Failures(平均故障間隔)
  • MTTD:Mean Time To Detect(平均偵測時間)
  • ROCOF:Rate of Occurrence of Failure(故障發生率)
  • CI/CD:Continuous Integration / Continuous Deployment(持續整合 / 持續部署)
  • RCA:Root Cause Analysis(根因分析)
  • CAB:Change Advisory Board(變更諮詢委員會)
  • ITIL:Information Technology Infrastructure Library(IT 基礎建設庫)
  • IaC / IaaC:Infrastructure as Code(基礎設施即程式碼)
  • APM:Application Performance Monitoring(應用效能監控)
  • OOP / OOPS:Object-Oriented Programming
  • SRE 四黃金指標:latency、saturation、traffic、error
  • CAMS:Culture、Automation、Measurement、Sharing

重要概念對應章節#

  • SRE 與 DevOps 比較 → 第 2 章
  • SLA / SLO / SLI → 第 1 章「SRE 的支柱」與第 6 章「指標辨識」
  • CAMS 模型 → 第 3 章「CAMS 模型」
  • 反模式與隱藏障礙 → 第 4、5 章
  • 可觀測性與監控工具 → 第 3 章「監控與可觀測性」、第 8 章「告警與監控工具」
  • 混沌工程實踐 → 第 6 章「及早參與 SDLC」、第 8 章「混沌測試工具」
  • 事件管理流程 → 第 3 章「事故管理流程」、第 6 章「建立強事故管理」
  • SRE 速查表 → 第 8 章「速查表」
  • 職涯與技能 → 第 9、10 章

工具索引#

監控與可觀測性#

  • ELK(Elasticsearch + Logstash + Kibana)
  • Prometheus、Grafana
  • Splunk、Dynatrace、AppDynamics、New Relic、Datadog
  • Nagios、VMware Aria Operations、Microsoft Application Insights

事件與變更管理#

  • ServiceNow ITSM、Jira Service Management
  • PagerDuty、OpsGenie、SolarWinds、Zendesk、TopDesk
  • ChangeGear、ChangeGrab、SpeKit
  • SymphonyAI ITSM

自動化、CI/CD、IaC#

  • Jenkins、GitHub Actions、GitLab、AWS CodeDeploy、Azure DevOps
  • Ansible、Terraform、Puppet、Chef、AWS CloudFormation

混沌工程#

  • Litmus、AWS Fault Injection Simulator、Azure Chaos Studio、Chaos Monkey

開發#

  • 語言:Python、Java、Go、Ruby、.Net、JavaScript、React、Angular
  • 開發 IDE:IntelliJ、VS Code、Sublime Text、Eclipse
  • 版控:GitHub、GitLab、Bitbucket、Azure DevOps、SourceForge

延伸閱讀#

  • 《Introduction to Algorithms》Cormen、Leiserson、Rivest、Stein
  • 《Operating System Concepts》Silberschatz、Galvin、Gagne

把這份附錄當作翻書地圖:當你在 production 遇到一個熟悉的詞彙,可以快速回到對應章節重溫脈絡。