演算法速度 • The Pragmatic Programmer 20週年紀念版

核心概念#

在 Topic 15（估算）中談到了估算走路時間或專案時程。但還有另一種務實程式設計師幾乎每天都在使用的估算：估算演算法消耗的資源——時間、處理器、記憶體等。

這類估算常常至關重要。你知道程式在 1,000 筆記錄下跑得順暢，但擴展到 1,000,000 筆時會怎樣？哪些部分需要最佳化？

答案通常可以透過常識、一些分析，以及一種叫做 Big-O 表示法的近似方法來回答。

Big-O 表示法是一種處理近似值的數學方法。當我們說某個排序例程對 n 筆記錄排序需要 O(n^2) 時間，我們是說最壞情況下所需時間大約與 n 的平方成正比。輸入數量翻倍，時間大約增為四倍。

Big-O 表示法設定了我們測量的東西的上界。它永遠不會給你實際的數字——它只告訴你這些值如何隨著輸入變化而變化。

Tip 63 - Estimate the Order of Your Algorithms（估算你的演算法的量級）

你可以用常識估算許多基本演算法的量級：

Tip 64 - Test Your Estimates（測試你的估算）

如果很難取得準確的時間數據，使用 code profiler 來計算演算法中各步驟的執行次數，並對照輸入大小畫圖。

選擇演算法要務實——最快的不一定是最好的。小資料集上，直接的插入排序可能和 Quicksort 一樣快，而且更容易寫和除錯。也要注意演算法的設置成本（setup cost）——小輸入時這些設置可能主宰了運行時間。

警惕過早最佳化（premature optimization）。先確認演算法真的是瓶頸，再投入時間去改進它。