兩種錯誤的對立#
關於語言複雜度的爭論存在兩個極端立場:
- 街頭常識:「原始民族說原始語言」——亞馬遜雨林的部落必然說一種比英語簡單的語言
- 語言學界教條:「所有語言同等複雜」——這是現代語言學最常被宣告的信條之一
本書作者古伊・多伊徹(Guy Deutscher)主張:兩邊都錯,但語言學界錯得更離譜。
為何「原始語言」的迷思如此頑固?#
語言學家狄克森(R. M. W. Dixon)在 1960 年代研究澳洲原住民語言時,遇到當地白人農夫對他說:「寫他們的語法應該很容易吧,大家都知道他們根本沒有語法。」當地電台主持人甚至驚訝:「你的意思是原住民有語言?我以為他們只會發出咕噥聲。」
這種印象來自哪裡?答案幾乎全部來自流行文化中的形象——
- 從丁丁歷險記到西部片,原住民總是說「Me no come, Sahib」這類破碎英語
- 但這種破碎語不是他們的母語,而是他們嘗試使用我們的語言
想像你被丟到一個沒人會說英語的村莊,手邊只有袖珍字典——你也只能擠出 “me sleep here?"。所有「精緻、得體、文法精巧」的我,瞬間蒸發。
田野事實:原住民語言絕非「原始」#
- 北美印第安語的單字結構極其複雜,動詞與前後綴疊得令人眼花
- 南美印第安語常有多種過去式,標記不同程度的「過去性」
- 亞馬遜的某部落(下一章將細談)要求說話者在每個句子中標記事件的「認識論狀態」,連最敏捷的律師都會結巴
沙皮爾(Edward Sapir)1921 年的名言精準總結:「在語法複雜度上,柏拉圖與馬其頓牧豬人並肩而行;孔子與阿薩姆獵頭土著同行。」
「同等複雜」教條為何也是錯的#
「不存在原始語言」與「所有語言同等複雜」並不等價。前者只是排除最簡陋的可能性;後者則是一個更強的主張——它要求所有語言在整體複雜度上精確相等。這就像說:「茱莉亞學院的鋼琴家都不是只會單指彈〈瑪麗有隻小綿羊〉的初學者」這句話為真,並不能推出「所有錄取生程度相同」。
一場找不到出處的「核心發現」#
弗洛姆金(Victoria Fromkin)與羅德曼(Robert Rodman)的經典教科書《語言學概論》在第一章就將「所有語言同等複雜」列為十二項基本知識之一。但若認真追問這項「中心發現」由誰、何時、用什麼方法發現——
作者多伊徹說:「我已經找了 15 年,從來沒有找到那個註腳。」這句口號從來沒有任何證據支撐——只是語言學家代代相傳的都市傳說。
唯一可追溯的源頭:霍凱特的「印象」#
最常被引用的源頭是霍凱特(Charles Hockett)1958 年《現代語言學教程》中的一段話。但霍凱特本人明確標示那只是他的「印象」(impressionistically),且推理是:
所有語言要做的工作大致同樣複雜,因此一個語言在某處(如詞法)較複雜,必定在另一處(如語法)較簡單以「補償」。
但這個推理本身就有缺陷:
- 大量語言的複雜度是「冗餘的歷史包袱」(如不規則動詞),對溝通並非必要,因此沒有補償壓力
- 反例:德語比英語在詞法上複雜得多(光是名詞複數至少有 7 種變化),但德語的語序規則也比英語更複雜——並無「補償」
- 兒童大腦的語言容量可以輕鬆學會兩種語言,因此單一語言遠未用盡其極限
因此,「所有語言應該收斂到同樣複雜度」並無先驗理由。
「整體複雜度」根本無法測量#
那麼為何不直接測量、然後比較?
問題是——沒有人能定義「一個語言的整體複雜度」是什麼。
嘗試一:以「外國學習者的難度」定義?#
行不通——學習難度高度依賴學習者的母語:
- 對義大利人,西班牙語易學;對英語人士,難很多
- 對泰語人士,中文比西班牙語簡單
- 對希伯來人士,阿拉伯語並不難
嘗試二:以「系統內部件數」定義?#
也不行——語言由不同種類的元件組成(音位、單字、語法成分、子句類型、詞序規則),這些根本無法相加比較:
- 一種語言比另一種多一個母音、少一個時態,誰更複雜?
- 這比「比較蘋果與柳橙」更糟,是「比較蘋果與紅毛猩猩」
結論#
「街頭常識」說「原始民族說原始語言」雖然事實錯誤,但至少是個有意義的命題; 但「所有語言同等複雜」比錯更糟——它是空話,與「所有語言同等等於玉米片」一樣無意義。
局部複雜度才有意義#
放棄「整體複雜度」這個幻影,改問特定領域的複雜度,問題就變得可操作。例如:
- 音位系統:數音素
- 動詞系統:數時態
- 詞法:數變化形態
- 語法:數子句類型
當這樣比較時,立刻發現語言間差異巨大——而這些差異是否反映社會結構才是真正有趣的問題。
領域 1:詞匯量——最無爭議的文化依賴#
| 類別 | 估計詞匯量 |
|---|---|
| 無文字社會語言 | 3,000–5,000 字 |
| 主要歐洲語言(雙語小型詞典) | 50,000+ 字 |
| 英語單語中型詞典 | 約 100,000 字 |
| 完整版牛津英語詞典(OED) | 約 300,000 字 |
| 大學生被動詞匯 | 約 40,000 字 |
| 大學講師被動詞匯 | 約 73,000 字 |
原因不難理解:無文字社會沒有「被動詞匯」傳承機制,一代不主動使用的字,下一代就消失了。
領域 2:詞法(Morphology)——意外的反向關係#
各語言在「單字內部承載多少資訊」上差異極大:
- 英語:動詞 walked 表達了「過去」但人稱另用獨立字(you / we)
- 阿拉伯語:時態與人稱皆內含於動詞內
- 中文:動詞本身既不顯時態也不顯人稱
- 夏威夷語:名詞不分單複數
- 索布語(斯拉夫語族):除了單複數還有「雙數」(hród / hródaj / hródy)
- 日語:指示代名詞分三層距離(koko / soko / asoko)
- 希伯來語:完全不分指示距離
帕金斯(Perkins)1992 年的研究#
對 50 種語言進行統計分析,將社會分為五級複雜度:
- 數家庭組成的「群」(band),純狩獵採集
- 略大群體,初現農業
- 「部落」,多以農業為主,有威權人物
- 「農民社會」,密集農業、小鎮、區域權威
- 都市社會,複雜社會政治宗教組織
結果與街頭常識相反:
社會越簡單,單字承載的資訊越多;社會越複雜,單字越簡化。 這是反向相關。
近年用「使用者人數」作代理指標的更大規模研究(涵蓋電子資料庫數百種語言)強烈支持帕金斯的結論。
解釋:熟人社會 vs. 陌生人社會#
人類學上,這個反向關係可從生活通訊型態理解:
1. 熟人社會 → 簡潔表達 → 易融合 → 詞法繁複#
- 對親近的人說話,「他們兩個又回去那裡了」就足夠——因為你們共享大量背景
- 大量「指代式」短語頻繁使用 → 容易磨合融合 → 變成詞綴 → 詞法日趨繁複
2. 陌生人社會 → 必須明說 → 不易融合 → 詞法日趨簡化#
- 對陌生人說話需鋪陳全部背景:「我妹瑪格麗特的未婚夫和他前女友的丈夫又回到河邊高級住宅區那間房子……」
- 指代短語使用減少 → 融合機會減少 → 詞法不易繁化
3. 接觸不同語言/方言 → 強迫簡化#
- 成人學習者最難掌握詞綴與詞內變化
- 大規模成人學習會推動詞法簡化
- 諾曼征服(1066)後的英語就是經典例子:原本的繁複詞法系統大幅崩解
4. 文字 → 抑制新融合#
- 口語中字與字之間沒有真正空隙,常用片語會自然融合
- 文字賦予「字」可見的獨立性,減緩融合的速率
印歐語的歷史佐證#
德國語言學家施萊歇爾(August Schleicher)的著名比喻:
- 哥德語「habaidedeima」(過去虛擬第一人稱複數的「擁有」)
- 對應到現代英語的單音節「had」
- 像是河床中滾動的雕像,肢體已被磨光,剩下一塊光滑的圓柱
原始印歐語有 8 個格、單複雙數加總接近 20 個變化,今日英語幾乎全數脫落,由介系詞接手。
領域 3:音位系統——尚無完整解釋#
| 語言 | 音位數 |
|---|---|
| 巴布亞新幾內亞 Rotokas | 11(6 子音 + 5 母音) |
| 夏威夷語 | 13 |
| 英語 | 約 33(13 母音 + 8 雙母音 + 子音) |
| 波札那 !Xóõ 語 | 140+(含 78 種點擊音 click) |
海伊(Jennifer Hay)與鮑爾(Laurie Bauer)2007 年研究 200+ 語言:
使用者越多 → 音位系統越大;社會越小 → 音位系統越精簡。 這是統計趨勢,但個別反例存在(如 1700 萬人使用的馬來語只有 22 個音)。
接觸其他語言可能促成新音位的引入,但這還無法完整解釋現象。
領域 4:句子複雜度(從屬子句)——可能與社會正相關#
這個領域可能符合街頭常識的直覺:社會越複雜,從屬子句越多。
從屬子句之美:可無限嵌套#
- 「我一定跟你提過那隻海豹」
- 「我一定跟你提過那隻正盯著一條魚的海豹」
- 「我一定跟你提過那隻正盯著一條不斷在冰冷水中竄出又潛入的魚的海豹」⋯⋯
理論上可以無限延伸,將多層命題編織成一句話。
古代語言依賴「並列」而非「從屬」#
西台語(Hittite)王室記事#
赫梯國王穆希利二世(Murshili II,西元前 14 世紀)描述自己中風的記錄,全篇以單調的 “and…and…” 結構並列:
我駕車前往昆努 / 來了一場雷雨 / 暴雨之神可怕地打雷 / 我害怕 / 我口中的話變小 / 話只能勉強冒出一點 / 我完全忘了這件事 / 但年復一年過去 / 這事重複出現在我夢中 / ……
阿卡德語(Akkadian)法律文件#
西元前 2000 年的訴訟記錄,本應是「Ubarum 證明他不知道 Iribum 自作主張拿了 Bazi 的田」,但原文用簡單並列:
Ubarum 告訴 Iribum 取 Kuli 的田
他(Iribum)自作主張
取了 Bazi 的田
Ubarum 不知道
他在監察官前證明了這件事「有限子句補語」(finite complement)的重要性#
英語裡 “He didn’t know that [Iribum took the field]” 這類結構可任意嵌套:
他不知道 [Iribum 拿了田]
Ubarum 證明了 [他不知道 [Iribum 拿了田]]
泥板說明 [Ubarum 證明了 [他不知道 [Iribum 拿了田]]]
碑刻學家發現 [泥板說明 [Ubarum 證明了 [他不知道 [Iribum 拿了田]]]]但:
- 古阿卡德語、古西台語完全沒有這種結構
- 至今仍有活著的語言不具備此構造(許多澳洲原住民語言、某些南美印第安語如下章將提到的 Matses)
弗洛姆金與羅德曼教科書的第 11 條「事實」說:「每種語言都有方式形成『Cecelia 知道你知道我知道語言學是有趣的學科』這類句子。」——這個「事實」根本不真。
為何複雜社會需要更多從屬結構?#
- 複雜資訊在缺少共享背景時,需要明確標示子句間的依賴關係
- 法律文書、學術論述、商業契約是極端例子——強調無歧義、不依賴脈絡
- 在大型陌生人社會中,這類溝通模式更頻繁出現
- 因此複雜社會傾向發展出更豐富的從屬結構
「並列」與「從屬」並非絕對的高下之分,而是反映溝通需求的差異。
全章總結:文化的影響不止於詞彙#
從亞里斯多德時代起,主流觀點是「只有標籤是文化約定,標籤背後皆屬自然」。但本部已揭示:
- 顏色:文化在自然原型外仍有相當自由
- 概念邊界:身體部位、親屬稱謂等大量領域都受文化影響
- 詞法複雜度:與社會結構呈反向相關
- 音位系統大小:與社會規模呈正向相關
- 從屬結構:可能隨社會複雜度而擴展
文化的觸角伸入語言的每個層面——不只是給概念貼標籤,而是塑造概念本身的形狀、組合方式、與表達結構。
進入第二部的橋樑#
第二部將繼續推進這個邏輯——既然文化形塑語言,那麼語言會反過來形塑思維嗎?這個問題在原則上是合理的,但在實踐上卻被學界視為「禁忌」。
下一章將揭示這個禁忌的源頭——一位名叫沃爾夫(Benjamin Lee Whorf)的人物,以及他如何把整個學界帶進了一個近乎不可信的迷宮。