什麼是索引(Index)#

在傳統的關聯式資料庫中,索引是加速資料查詢的核心機制。這個概念同樣適用於更大規模的資料集

設計索引時,必須仔細考慮使用者如何存取資料,因為索引的結構直接影響查詢效率。

為什麼需要索引#

  • 當資料集規模達到數 TB,但每筆資料的 payload 很小(例如 1 KB)時,索引是最佳化資料存取的必要手段
  • 在如此龐大的資料集中尋找一筆小資料是極大的挑戰——不可能在合理時間內遍歷所有資料
  • 大型資料集通常分散在多台實體裝置上,因此需要某種方式來定位資料的正確實體位置

索引(Index)是解決上述問題的最佳方式:它能快速定位目標資料的位置,避免全量掃描。