寫科技論文的技巧#
科技論文的標準結構:五大要素#
在第三十四封信中,吳軍詳細拆解了一篇合格的科技論文(或技術報告)必須包含的五個核心部分。這套結構是學術界通用的語言,確保了知識能夠被有效積累與傳遞。
1. 提出問題與回顧前人貢獻#
學術研究不是憑空而來的,大多是在前人基礎上的延伸(N+1 的工作)。
- 提出問題:清晰定義你要解決什麼問題。
- 前人貢獻:尊重並回顧相關領域的既有成果,說明你的研究與他們的關係。
2. 詳細敘述所做工作與結論#
這是論文的核心。敘述必須足夠清晰、邏輯嚴密。
可重複性 (Reproducibility):
寫作的標準在於:讓同行在閱讀完你的敘述後,能夠依照同樣的步驟重複呈現你的實驗或結果。
如果別人無法重現,這項研究就缺乏科學價值。
3. 比較與驗證#
單有結論是不夠的,必須透過比較來證明你的改進。
- 建立基準 (Baseline):通常需要先重複他人的實驗,確立基準線。
- 比較差異:在此基礎上展示你的方法帶來了哪些具體的改進或優勢。
4. 使用同行通用的資料#
「可對比性」 在科學中非常重要。
- 應盡量使用同行所能取得的公開資料集(Benchmark)或標準數據。
- 如果使用自己私有的數據,他人無法驗證真偽,也無法進行橫向對比,研究的可信度會大打折扣。
5. 誠實講述未完成的工作#
科學是永無止境的。誠實地列出自己研究的局限性、未解決的問題,以及下一步可能的方向,這展現了治學的嚴謹態度。
寫作的四大禁忌#
除了該有的結構,吳軍也特別提醒了四個必須避免的「坑」,這些行為會嚴重損害作者的學術聲譽:
1. 吹牛 (Overselling)#
科學講求客觀。過度誇大自己研究的重要性,或使用充滿行銷色彩的形容詞,只會讓專業讀者感到反感。
2. 貶低同行#
試圖透過貶低他人的工作來顯示自己多有水準,這是極度缺乏自信與修養的表現。真正好的工作,是建立在對前人的尊重之上。
3. 喧賓奪主:紀錄次要現象#
論文篇幅有限,應聚焦於核心發現。 不要花大篇幅去紀錄那些次要的、瑣碎的現象或發現,這會模糊焦點,讓讀者抓不到重點。
4. 剽竊:未標明出處#
這是學術界的死罪。 引用別人的資料、觀點或圖表時,必須嚴格標明出處。這不僅是版權問題,更是對原創者的基本尊重。
好的科技論文,其價值在於「增量」(N+1)。
它應該是誠實、客觀、可驗證的,並且對同行的工作保持敬意。
《數學之美》的翻譯緣起#
這封信起源於女兒夢華參與翻譯吳軍的著作《數學之美》英文版。在翻譯過程中,她和吳軍討論了專業論文和專著的寫法,特別是它們與一般內容的文章和圖書在寫作方法上的不同。
吳軍首先說:「你的文筆非常漂亮、雋美,今天我說我幫我翻譯一篇作文,文采一定不如你。你幫我翻譯《數學之美》,文字水平非常高,我很滿意。不過,寫科技論文還是有些特點,或者說有些技巧的。」
科技論文的基本原則#
在什麼場合就要用什麼語言,不混著用。
- 因此,寫科技論文就要用科技論文的語言。
- 它不僅是非常規範的書面語,而且不能有太多比喻和誇張的形容詞。
- 那樣會讓人感覺有點兒不真實。
- 為了這個原因,科技論文讀起來有點兒枯燥,但是沒有辦法,因為這類論文的準確性比趣味性更重要。
論文不同於散文,它的結構遠比文字重要,結構不對,文字再優美也沒用。
如果你將來有機會寫科技論著,反而可以在語言上輕鬆一點兒。
N+1 的真相:學術研究的本質#
今天的學術研究,99% 是 N+1 的工作,不管你怎麼吹它的重要性,還是 N+1。
也就是說,你發現前人的工作有改進性,這本身就是足夠寫的。既然是 N+1 的工作,任何論文裡都有一部分事情就是要做 N 前的工作,這部分內容既是為了說明研究的問題的來源(前人尚未完成的工作),也是前人和同行的貢獻。
一些中國人請幫助修改論文,工科通常是從中英文後再改過去寫,但是我發現他們論文的結構有大問題,就是沒有這樣的工作。讀者一下子就看不到你的創造有多大,同行沒有了感情,覺得你沒有引用他們的工作,也就不高興。
驗證自己的結論:實驗室的靈魂#
第二,自己的工作都需要到什麼樣,這是論文之魂。
當然,在人文學科和社會科學的論文中,這是以論據為主;在工科的論文中,就是以實驗為主做的。
自己的觀點都需要有別人支持自己論點的實證數據,有的沒有,都要求很大量的輔助實證、對比實驗。對於任何好的論文,數據的實驗結果都要符合預期,才能服人。
當然,最重要的是如何符合預期、取得好的結果;然而,在努力而無法達到預期結果的情況下,給出一個可信的普通結果,一些急於求成的科學家在發表具有轟動效應的結論時,常常把不利於取得論文結論的實驗結果隱瞞,以致同行無法複現他們的實驗。這種做法違背了學術道德。
對比研究:實驗可重複性#
尤其是對於做研究的人來說,論文的結論應該是提供給同行驗證和對比的標準。
很多研究論文公布自己的工作和具體的研究成果,也是為了增加對比驗證的機會。
既然做研究是 N+1 的工作,我們為了證明 N+1 比原來的好要多,你首先要重複被前人 N 個人的工作。
因為如果你從頭進行重要基本新論文所採取的全部測試,還不一定能做對那個 N 做的工作,所以一個有經驗的導師在指導學生做實驗時,通常是不讓自己的實驗所這樣,然後只幫助他們在原有工作上自己的改進。
將實際成就的論文,一般都是從最大限度的改進自己實驗的成果(N+1 改為 N+2)。
使用同行通用的數據:可比性#
為了實驗所得的數據,要當他能提供的方法都能得到足夠好的結果。可比性對科學研究非常重要。為了讓大家有一個可以公平比較的方法,各個學科領域都有很多自己用的測試——測試資料、材料等等,供同行使用。這些是就整個學術領域的東西,大家非常重視、對比。
如果你研究的是很相關。後於是使用的是不相關的數據,需要很長時間讀到你文、閱讀論文的讀者都是不關心的。從這個角度,大公司就要通通建立一個給大家進行學術交流,常常要建設一個給學術圈使用的基準平台。
Google 與 1 億美元的醫療研究基準#
有時,建這樣一個數據平台甚至要花很多錢。
吳軍過去所在的語音識別和自然語言處理領域,賓夕法尼亞大學就有專門一個小組為全世界的學者準備研究和測試數據。
2015 年,Google 為了讓全世界的大數據醫療研究有一個可以做對比實驗的基準,拿出 1 億美元給了斯坦福和杜克兩所大學的醫學院,用 5 年時間採樣 5000 人(各 2500 人)的全部生理和醫療數據,作為將來全世界在相關領域研究的共同基礎。
非自然科學的論文:SEC 的數據#
對於非自然科學的論文,使用的數據一定要是同行也能夠得到的,比如在經濟學上,大家常常採用世界銀行、美國中央情報局、美國統計局的數據。我在寫《浪潮之巔》分析公司的經營狀況時,一般都引用它們向美國證監會(SEC)提供的數據,而不是《華爾街日報》的二手數據。
誠實講述未完成的工作#
此外,如果一個研究人員在前人的基礎上更進一步,那是一件可喜可賀的事。
但是,完成了 N+1,將來就會有 N+2,因此好的論文最後都會從學術角度,講一下自己未完成的工作。這些工作或許是自己正在進行的,或許是留給同行的。至此,一篇論文才算完整。
從這個寫作過程可以看出,它似乎就是一篇中規中距的文章,有點像中國過去的八股文。學術界對規矩從來是非常看重的,一旦守規矩,寫出來的必然就是「八股文」,沒有太多可以發揮的餘地。
能夠按照上述的條條框框寫出一篇「八股文」,至少是符合要求的。
寫科技論文的三大忌#
寫科技論文,下面三件事一定不要做,不會有好處,只會幫倒忙。
第一:吹牛#
過分強調自己研究的重要性,上升到非常高的高度,生怕立意不夠高被拒絕,這樣的做法是在幫倒忙。
很多學者的論文有這樣的毛病,喜歡宣布自己解決了一個天大的難題,可以改變世界等,即便是真的,也都是廢話。在學術圈子里,同行對這項研究的背景和意義都比較清楚,意義是否重大,無須費太多口舌。
有時,一些人工作本來做得還不錯,這麼一寫,讀者反而不知道哪些工作是他完成的,哪些是吹牛了。科技論文不是新聞報道,不需要什麼事情都要往大的高度。
至於發明和發現是否重要,一切有結果就清楚了。那些大話、廢話,除了占用寶貴的篇幅,對論文沒有幫助,甚至只有副作用。
同樣,不僅是寫論文,在申請經費報告中也是如此。
第二:貶低同行的話#
一些人為了顯示自己的工作多麼有水平,自吹自擂,把前人的工作貶得一無是處。要知道,審稿的人,可能就是那些被貶低的同行。 是否任何工作做得好,有了數據自然明了,不需要抬高自己,貶低別人。
第三:寫次要現象#
對於一些次要的,但是需要花特別多篇幅才能解釋清楚的現象或者發現,根本就不需要寫在論文里,因為這反而會讓讀者更糊塗。
一篇論文能說清楚一件事,給大家一個明確的結論,就非常有意義了。
兩個細節:誠實致謝#
最後,要注意兩個細節:
- 在論文中,凡是別人的數據和觀點都要寫明出處。
- 對於任何在做研究和寫論文過程中給了幫助的人,都要鳴謝。
至此,一篇完整的論文就完成了。