群體真的比較聰明嗎?#
作者 Joshua Becker、Douglas Guilbeault、Edward “Ned” Smith 把矛頭指向一個被廣泛接受的信念:群體智慧(collective intelligence)。研究確實顯示,當管理得當時,請一群人討論能比單純平均多位獨立顧問的建議得出更準確的估計。
但他們發表在《Management Science》的研究發現一個關鍵反例:
群體討論能提升預測準確度;但同樣的討論,會讓最終決策的準確度下降。
過去的群體智慧研究多聚焦在量化問題:「這個產品上市要多久?」「這個專案要花多少錢?」「這個求職者打幾分?」 — 這類問題討論能改善估計。
但是非題(yes/no)就不一樣了:「這個產品會準時上市嗎?」「會超出預算嗎?」「他達到我們的標準嗎?」 — 群體討論會降低做對決定的機率。
為什麼會這樣#
研究發現,群體討論常常做兩件事:
- 放大初始多數意見 — 即使該意見是錯的
- 把原本正確的多數,翻轉成錯誤的多數
關鍵:即使等到對話結束才投票也一樣。讓量化估計變準的同樣的社交動力,也會把不確定的少數派意見鞏固成強烈共識。
一個容易理解的範例#
假設五人團隊估計專案完成時間,並就「能否在 9 個月內完成」投票。實際答案是 10 個月(投「不能」才是對的)。
| 階段 | 各人估計(月) | 平均 | 投票 |
|---|---|---|---|
| 討論前 | 4, 5, 10, 11, 13 | 8.6 | 3 票「No」、2 票「Yes」 → 正確 |
| 討論後 | 8, 8, 9, 9, 13 | 9.4 | 4 票「Yes」、1 票「No」 → 錯誤 |
平均估計從 8.6 → 9.4,確實更接近 10。但同樣的討論卻把投票從「正確」翻轉成「錯誤」。只剩一位異議者,主管很容易被多數共識說服「沒事,會準時」 — 結果連備援計畫都不做。
研究團隊分析了 450 多個 10-40 人的實驗群體,提問題如「罐子裡有幾顆口香糖?」「美國多少 % 人有健保?」、討論前後比較。結果:
- 量化估計多半改善
- 但群體有 80% 的機率反轉初始正確答案,或不論對錯地放大初始多數
三個策略:從群體討論中得到智慧、避開陷阱#
1. 討論資料,不要預測結果#
鼓勵團隊分享:
- 個人經驗
- 事實與資料
避免:
- 數字估計
- 決策建議
舉例:在討論產品上市的會議中,下列這類資訊有幫助:
- 「我們上次給這位客戶的產品延遲了,因為他們臨時要改一個關鍵功能」
- 「UX 團隊最近三個專案都提前完成」
而下列這類發言會把對話推向同質化:
- 「我覺得會延遲」
- 「我覺得三個月內會完成」
「社交互動讓意見趨同」這個天然傾向正是讓量化估計變準的機制,但它也是讓最終投票失準的元兇。
2. 把「多少?」與「Yes/No?」分開#
利用群體智慧、又保留決策準確度的方法:明確分開預測討論與最終決定。
兩種具體做法:
- 讓群體討論並產生量化預測 → 取平均 → 最終決定留給主管
- 若需要民主投票:讓 A 群體討論並產出預測 → 把預測交給 B 群體 → B 群體不討論,僅根據預測投票
幾乎所有決定都隱含某種預測:
- 「自建還是外購(build or buy)」其實是在問成本與效益
- 公共政策的「是否實施」其實是在問參與率與影響度
- 是否會超預算、投資是否回報、風險是否可承受 — 都需要量化估計
即使最終目標是做決定,幾乎總是可以把那個決定從群眾預測討論中分離出來。
3. 蒐集團體動態的資料#
一個反直覺的發現:
- 在討論後修改自己估計幅度較小的人(也就是「比較固執」的人)
- 往往也比較準確
長期追蹤團隊成員意見的演變與最終結果,你會建立有價值的元資料:
- 誰的判斷在哪類問題上更值得信賴?
- 不同人擅長估計不同類型的問題(有人擅長進度、有人擅長成本)
- 自信的人是常對還是常錯?
把這些資料記下來,下次能對的人問對的問題。
結論#
群體往往能得出比個人更準的估計 — 但讓估計變準的社交影響力,同樣會讓 yes/no 決策變糟。
主管應該:
- 把群體討論限制在事實而非判斷
- 分開預測討論與決策
- 用過去的資料持續迭代與改善自己的決策流程