為什麼需要 Observability#

監控(Monitoring)回答「系統正不正常」,可觀測性(Observability)回答「為什麼不正常」。當系統從單體演進到微服務、容器、Serverless,故障路徑不再線性,傳統 alert 不夠用。Observability 透過三大訊號 — Logs(日誌)、Metrics(指標)、Traces(追蹤)— 加上現代化工具鏈,讓你能事後回放、跨服務追因、提前預警。

章節地圖#

子主題範疇
01-concepts開篇 + Observability 的過去與現在
02-metricsGrafana、Prometheus、Exporter、Mimir、Cortex、Thanos、StatsD、Zabbix
03-logsLoki、Promtail、Fluent Bit、Vector
04-tracesOpenTelemetry SDK、Tempo、Jaeger、OTel Collector
05-correlationSignal Correlation、Span Metrics、Profiles + eBPF
06-productionGrafana Agent/Cloud、上線準備、SPOF 防範、資料保留期
07-closingObservability 的未來

關聯閱讀#