閱讀 John Carreyrou 破解比特幣最大謎團之心得

April 9, 2026 · 閱讀時間約 12 分鐘

洪愷尹 洪愷尹
洪愷尹

讀《紐約時報》調查中本聰身分的報導,整理其研究框架、語言學分析方法與訪查手段的學習筆記

John Carreyrou

John Carreyrou

閱讀 John Carreyrou 破解比特幣最大謎團之心得

有人花了一年,在幾十年前的論壇貼文裡,數了 325 個連字號錯誤。

不是找「誰寫得像中本聰」,而是找「誰跟中本聰錯得一樣」。

原文連結在這裡:https://www.nytimes.com/2026/04/08/business/bitcoin-satoshi-nakamoto-identity-adam-back.html

我讀完,腦子裡卡住的不是「答案是誰」,而是「這種方法是怎麼想出來的」。大多數人看到這種題目,第一反應是:「快告訴我,答案是誰?」但作者做了另一件事:他把一個本質上「無法終局證明」的問題,轉化成一條可驗證、可辯論的研究路徑。


▉ 關於作者:考古學家式的調查記者

在深入分析這個調查框架之前,有必要先認識一下這篇文章的作者 John Carreyrou(協同 Dylan Freedman)。

如果你聽過 Theranos 醜聞,那妳可能已經知道 John Carreyrou 是誰。他是那個用調查報導揭穿 Elizabeth Holmes 血液檢測詐騙案、讓這家估值 90 億美元的獨角獸崩塌的華爾街日報記者。

他因為那項調查獲得了 普立茲獎,後來也把過程寫成暢銷書《Bad Blood》。

Carreyrou 的方法論很獨特:他願意花一年、兩年的時間,像考古一樣挖掘散落在各處的碎片:舊的郵件列表、論壇貼文、公司文件,然後把它們拼成一張完整的圖。

這次為了找中本聰,他花了一年時間,翻閱了數千個數十年前的網路貼文。這種調查深度和耐心,在現在這個追求即時的新聞環境裡,已經很少見了。

為什麼作者背景很重要?因為在閱讀任何調查報導之前,讀者必須先回答一個問題:我是否信任這個研究者的「建材」?如果建材本身不合格,大樓蓋得再漂亮也只是沙上建塔。

Carreyrou 的過往紀錄,給了我們一個起點的信心:這是一位資深調查記者的嚴謹作品。


▉ 從「證明」到「逼近」的思路轉換

讀這篇文章最讓我佩服的,是作者如何處理一個本質上「無法最終證明」的問題。

中本聰是誰,可能永遠不會有法律級的證明宣判,除非當事人自己站出來,用加密學的方式簽名驗身。但作者沒有因為這個困境就放棄,而是換了一個思路:雖然無法「證明」,但可以「逼近」。

這個思路轉換很關鍵。它不是要一次性猜中答案,而是設計一個讓錯誤逐步被排除的篩選過程。這就像是在搜索空間裡做二分查找:每次迭代都把可能性砍掉一半,最終收斂到一個極小的區間。

作者起手不是盲猜,而是先畫出約束條件。從語言習慣(英式/美式拼寫混用)和社群背景(密碼學郵件列表)兩個方向縮小搜尋空間。

這就像工程師面對一個複雜系統時,第一步不是亂試,而是先識別系統的邊界條件。

▉ 資料工程:母體定義決定一切

接著作者做了最枯燥、但可能最重要的一步:把三個郵件列表變成可查詢的資料庫,然後一層一層地篩選。

  • 原始發文者超過 34,000 人
  • 剔除低活躍與噪音帳號,縮到 1,615 人
  • 再剔除未討論數位貨幣者,縮到 620 人

這步看似無聊,但其實決定了整個調查是否能站得住腳。太多調查會直接跳到「某人很像」的結論,但如果母體沒有被嚴謹定義好,後面再漂亮的推理都可能只是幻覺。

用統計學的語言來說,這是在定義「樣本空間」。如果樣本空間本身是錯的,後面的所有計算都毫無意義。

資料工程不是技術附屬品,而是調查可信度的本體。這就像是在蓋房子之前,必須先確認地基夠穩固。

▉ 多個弱訊號交叉的機率結構

最精彩的部分,是作者如何用一個個看似微不足道的特徵,慢慢把候選人從 620 人篩到 1 人。

我們無法把這解讀成法律的證明,但它顯示了一件事:當多個獨立的、微弱的特徵,往同一個方向上同時收斂,機率的結構就已經改變了。

用機率論的語言來說:如果每個特徵都給出 60% 的可信度,十個獨立特徵同時指向同一個人,那麼聯合機率就已經遠超隨機水準。

真相往往不是某個鐵證,而是十個不起眼的巧合疊在一起,你開始相信那不只是巧合。

這就像密碼學裡的「多重簽章」:單一簽章可能被偽造,但多個獨立簽章同時驗證通過,偽造成本就會呈現指數級上升。


▉ Stylometry 的數學原理

這篇文章用到的語言學工具叫 stylometry(文體計量),基本原理是:每個人的文字都有獨特的「指紋」,就像筆跡一樣。

從技術角度來看,stylometry 其實就是一個特徵提取與分類問題。你把文字映射到一個高維特徵空間,每個維度代表一個語言習慣(拼寫、標點、詞彙、句式),然後在這個空間裡計算相似度。

這些指紋包括:

  • 拼寫偏好(英式 vs 美式)
  • 標點符號習慣(句號後的空格數)
  • 語法錯誤模式(it’s/its 混用)
  • 詞彙選擇(e-mail vs email)
  • 句式結構(句尾 also 的使用)

有趣的是,這些特徵很多是「無意識」的:你刻意改變口吻時,能偽裝大的風格,但很難偽裝這些微小的習慣。

為什麼?因為有意識的偽裝通常只會作用在「顯性層面」(像是用詞、語氣),但很難觸及「隱性層面」(像是標點空格、拼寫切換)。這些隱性習慣已經內化成了肌肉記憶。

▉ 跨洋語言習慣的生活軌跡

中本聰文字的一個有趣特徵,是英式和美式拼寫混用(如 optimise/optimize 切換)。這暗示著一個在不同語言環境來回移動的人。

這種「語言擺盪」本身也是一種線索。它指向的是某種生活經歷,而不只是單純的國籍標籤。

一個從小在英國受教育、後來到美國工作的人,他的拼寫可能會在某些詞彙上保留英式習慣,但在其他詞彙上採用美式用法。這種「混用模式」本身就是一個高維特徵,比單純的「英式或美式」更難偽裝。

▉ 連字號作為驗證工具:錯誤比正確更難偽裝

作者用《紐約時報》的連字號規範當基準,找出中本聰文本裡 325 個連字號錯誤型,然後去比對候選人。第一名重合 67 處,第二名只有 38 處。

這個方法很聰明:你不是看「哪裡像」,而是找「哪裡錯得一樣」。

為什麼這個思路很重要?因為正確的寫法可以模仿,但錯誤的習慣很難偽裝。一個人的錯誤模式往往來自於學習過程中的某種「固化偏差」:你第一次學錯的東西,如果沒有被刻意糾正,就會變成習慣。

兩個人在同一個錯誤上重合,可能是巧合。但 67 個獨立的錯誤同時重合,那就很難用巧合解釋了。

這就像是在密碼學裡驗證簽章:你不只是看簽章格式對不對,你還要看簽章裡的每一個位元是否完全匹配。任何一個位元的差異,都足以拒絕整個簽章。


▉ 時間不是背景,是證據

我很欣賞作者的一個做法:把行為時間軸拉進來交叉驗證。

不是只看語言像不像,還看時間上的「出現—消失—再出現」模式。某人長年在電子現金議題高強度發言,但在中本聰高活躍期對比特幣異常沉默,中本聰消失後又開始高強度投入比特幣討論。

這種模式不能單獠定罪,但能提高或降低假說權重。作者沒有把時間當背景,而是把時間當證據。

為什麼時間軸重要?因為任何刻意偽裝都有「代價」:你必須在某個時期投入額外精力來維持偽裝。而這種代價,往往會在時間維度上留下痕跡。

如果一個人長年對某個議題高度投入,突然在某個關鍵時期完全沉默,然後又突然恢復高強度參與。這種時間模式本身就在說話。

▉ 從紙面到現場:登門驗證

最後,Carreyrou 去敲了他的門。

文章裡沒有給出承認。這不意外。終局答案從來都不在那個場景裡。

好的調查不是「我有一堆資料」,而是「我願意把資料放到對方可反駁的場景」。作者敲那扇門,不只是為了得到答案。反而是去測試那個人說話的方式,測試他如何繞過某個問題,測試那些話語背後的微小震顫。這些也是證據。

就像科學實驗:結果不一定給出答案,但會告訴你假說的哪個部分需要修正。面對對質時的回應模式本身,也是證據的一部分。


▉ 證據鏈的層次分析

讀完這篇文章,我們嘗試用以下框架來評估證據強度:

第一層:語言習慣

  • 拼寫混用模式高度吻合
  • 連字號錯誤重合度遠超第二名(67 vs 38)
  • 標點與句式習慣一致
  • 強度:高

第二層:時間軸模式

  • 出現—消失—再出現的節奏符合「有意識隱藏」的假說
  • 在關鍵時期的異常沉默難以用巧合解釋
  • 強度:中高

第三層:社群背景

  • 密碼學郵件列表的參與者身份完全對得上
  • 技術能力足以設計比特幣系統
  • 強度:中(必要條件,但非充分條件)

第四層:自證

  • 缺少決定性的加密學簽名驗證
  • 當事人未承認
  • 強度:無

如果必須給一個概率,這會是「比隨機高很多,但還不到法律級證明」。這不是因為證據不夠強,而是因為問題本身的約束條件:終局證明需要當事人自證,而這件事可能永遠不會發生。


▉ 什麼是「身份證明」?

這篇文章其實觸及了一個深刻的問題:在數位時代,什麼是「身份證明」?

傳統上,我們認為身份證明需要有法律或是生物上的決定性:護照、指紋、DNA、密碼學簽名。但這篇文章展示了另一種可能性:身份證明可以是「概率性的」,是由多個弱證據收斂而成的一個「足夠可信」的結論。

有趣的是,這篇文章探討的「身份證明」問題,其實和比特幣本身的「交易證明」問題形成了某種對應。

比特幣用工作量證明解決了「誰擁有這筆錢」的問題,而不需要中心化的權威機構。而這篇調查報導,嘗試用「證據鏈證明」來解決「誰是中本聰」的問題,也不依賴當事人的自證。


▉ 結語

謎題本身可能永遠不會有終局,但追尋謎題的方式,本身就是一種終局與有趣之處。

Tags