為什麼需要 Observability#
監控(Monitoring)回答「系統正不正常」,可觀測性(Observability)回答「為什麼不正常」。當系統從單體演進到微服務、容器、Serverless,故障路徑不再線性,傳統 alert 不夠用。Observability 透過三大訊號 — Logs(日誌)、Metrics(指標)、Traces(追蹤)— 加上現代化工具鏈,讓你能事後回放、跨服務追因、提前預警。
章節地圖#
| 子主題 | 範疇 |
|---|---|
| 01-concepts | 開篇 + Observability 的過去與現在 |
| 02-metrics | Grafana、Prometheus、Exporter、Mimir、Cortex、Thanos、StatsD、Zabbix |
| 03-logs | Loki、Promtail、Fluent Bit、Vector |
| 04-traces | OpenTelemetry SDK、Tempo、Jaeger、OTel Collector |
| 05-correlation | Signal Correlation、Span Metrics、Profiles + eBPF |
| 06-production | Grafana Agent/Cloud、上線準備、SPOF 防範、資料保留期 |
| 07-closing | Observability 的未來 |
關聯閱讀#
- DevOps / 監控與發布 →
../05-devops/08-monitoring-release - Kubernetes 生態 →
../08-kubernetes - 微服務可觀測性 →
../04-microservices/08-observability - 分散式系統理論 →
../06-distributed-systems