閱讀 John Carreyrou 破解比特幣最大謎團之心得

April 9, 2026 · 閱讀時間約 12 分鐘

洪愷尹

讀《紐約時報》調查中本聰身分的報導，整理其研究框架、語言學分析方法與訪查手段的學習筆記

John Carreyrou

閱讀 John Carreyrou 破解比特幣最大謎團之心得

有人花了一年，在幾十年前的論壇貼文裡，數了 325 個連字號錯誤。

不是找「誰寫得像中本聰」，而是找「誰跟中本聰錯得一樣」。

原文連結在這裡：https://www.nytimes.com/2026/04/08/business/bitcoin-satoshi-nakamoto-identity-adam-back.html

我讀完，腦子裡卡住的不是「答案是誰」，而是「這種方法是怎麼想出來的」。大多數人看到這種題目，第一反應是：「快告訴我，答案是誰？」但作者做了另一件事：他把一個本質上「無法終局證明」的問題，轉化成一條可驗證、可辯論的研究路徑。

▉ 關於作者：考古學家式的調查記者

在深入分析這個調查框架之前，有必要先認識一下這篇文章的作者 John Carreyrou（協同 Dylan Freedman）。

如果你聽過 Theranos 醜聞，那妳可能已經知道 John Carreyrou 是誰。他是那個用調查報導揭穿 Elizabeth Holmes 血液檢測詐騙案、讓這家估值 90 億美元的獨角獸崩塌的華爾街日報記者。

他因為那項調查獲得了 普立茲獎，後來也把過程寫成暢銷書《Bad Blood》。

Carreyrou 的方法論很獨特：他願意花一年、兩年的時間，像考古一樣挖掘散落在各處的碎片：舊的郵件列表、論壇貼文、公司文件，然後把它們拼成一張完整的圖。

這次為了找中本聰，他花了一年時間，翻閱了數千個數十年前的網路貼文。這種調查深度和耐心，在現在這個追求即時的新聞環境裡，已經很少見了。

為什麼作者背景很重要？因為在閱讀任何調查報導之前，讀者必須先回答一個問題：我是否信任這個研究者的「建材」？如果建材本身不合格，大樓蓋得再漂亮也只是沙上建塔。

Carreyrou 的過往紀錄，給了我們一個起點的信心：這是一位資深調查記者的嚴謹作品。

▉ 從「證明」到「逼近」的思路轉換

讀這篇文章最讓我佩服的，是作者如何處理一個本質上「無法最終證明」的問題。

中本聰是誰，可能永遠不會有法律級的證明宣判，除非當事人自己站出來，用加密學的方式簽名驗身。但作者沒有因為這個困境就放棄，而是換了一個思路：雖然無法「證明」，但可以「逼近」。

這個思路轉換很關鍵。它不是要一次性猜中答案，而是設計一個讓錯誤逐步被排除的篩選過程。這就像是在搜索空間裡做二分查找：每次迭代都把可能性砍掉一半，最終收斂到一個極小的區間。

作者起手不是盲猜，而是先畫出約束條件。從語言習慣（英式/美式拼寫混用）和社群背景（密碼學郵件列表）兩個方向縮小搜尋空間。

這就像工程師面對一個複雜系統時，第一步不是亂試，而是先識別系統的邊界條件。

▉ 資料工程：母體定義決定一切

接著作者做了最枯燥、但可能最重要的一步：把三個郵件列表變成可查詢的資料庫，然後一層一層地篩選。

原始發文者超過 34,000 人
剔除低活躍與噪音帳號，縮到 1,615 人
再剔除未討論數位貨幣者，縮到 620 人

這步看似無聊，但其實決定了整個調查是否能站得住腳。太多調查會直接跳到「某人很像」的結論，但如果母體沒有被嚴謹定義好，後面再漂亮的推理都可能只是幻覺。

用統計學的語言來說，這是在定義「樣本空間」。如果樣本空間本身是錯的，後面的所有計算都毫無意義。

資料工程不是技術附屬品，而是調查可信度的本體。這就像是在蓋房子之前，必須先確認地基夠穩固。

▉ 多個弱訊號交叉的機率結構

最精彩的部分，是作者如何用一個個看似微不足道的特徵，慢慢把候選人從 620 人篩到 1 人。

我們無法把這解讀成法律的證明，但它顯示了一件事：當多個獨立的、微弱的特徵，往同一個方向上同時收斂，機率的結構就已經改變了。

用機率論的語言來說：如果每個特徵都給出 60% 的可信度，十個獨立特徵同時指向同一個人，那麼聯合機率就已經遠超隨機水準。

真相往往不是某個鐵證，而是十個不起眼的巧合疊在一起，你開始相信那不只是巧合。

這就像密碼學裡的「多重簽章」：單一簽章可能被偽造，但多個獨立簽章同時驗證通過，偽造成本就會呈現指數級上升。

▉ Stylometry 的數學原理

這篇文章用到的語言學工具叫 stylometry（文體計量），基本原理是：每個人的文字都有獨特的「指紋」，就像筆跡一樣。

從技術角度來看，stylometry 其實就是一個特徵提取與分類問題。你把文字映射到一個高維特徵空間，每個維度代表一個語言習慣（拼寫、標點、詞彙、句式），然後在這個空間裡計算相似度。

這些指紋包括：

拼寫偏好（英式 vs 美式）
標點符號習慣（句號後的空格數）
語法錯誤模式（it’s/its 混用）
詞彙選擇（e-mail vs email）
句式結構（句尾 also 的使用）

有趣的是，這些特徵很多是「無意識」的：你刻意改變口吻時，能偽裝大的風格，但很難偽裝這些微小的習慣。

為什麼？因為有意識的偽裝通常只會作用在「顯性層面」（像是用詞、語氣），但很難觸及「隱性層面」（像是標點空格、拼寫切換）。這些隱性習慣已經內化成了肌肉記憶。

▉ 跨洋語言習慣的生活軌跡

中本聰文字的一個有趣特徵，是英式和美式拼寫混用（如 optimise/optimize 切換）。這暗示著一個在不同語言環境來回移動的人。

這種「語言擺盪」本身也是一種線索。它指向的是某種生活經歷，而不只是單純的國籍標籤。

一個從小在英國受教育、後來到美國工作的人，他的拼寫可能會在某些詞彙上保留英式習慣，但在其他詞彙上採用美式用法。這種「混用模式」本身就是一個高維特徵，比單純的「英式或美式」更難偽裝。

▉ 連字號作為驗證工具：錯誤比正確更難偽裝

作者用《紐約時報》的連字號規範當基準，找出中本聰文本裡 325 個連字號錯誤型，然後去比對候選人。第一名重合 67 處，第二名只有 38 處。

這個方法很聰明：你不是看「哪裡像」，而是找「哪裡錯得一樣」。

為什麼這個思路很重要？因為正確的寫法可以模仿，但錯誤的習慣很難偽裝。一個人的錯誤模式往往來自於學習過程中的某種「固化偏差」：你第一次學錯的東西，如果沒有被刻意糾正，就會變成習慣。

兩個人在同一個錯誤上重合，可能是巧合。但 67 個獨立的錯誤同時重合，那就很難用巧合解釋了。

這就像是在密碼學裡驗證簽章：你不只是看簽章格式對不對，你還要看簽章裡的每一個位元是否完全匹配。任何一個位元的差異，都足以拒絕整個簽章。

▉ 時間不是背景，是證據

我很欣賞作者的一個做法：把行為時間軸拉進來交叉驗證。

不是只看語言像不像，還看時間上的「出現—消失—再出現」模式。某人長年在電子現金議題高強度發言，但在中本聰高活躍期對比特幣異常沉默，中本聰消失後又開始高強度投入比特幣討論。

這種模式不能單獠定罪，但能提高或降低假說權重。作者沒有把時間當背景，而是把時間當證據。

為什麼時間軸重要？因為任何刻意偽裝都有「代價」：你必須在某個時期投入額外精力來維持偽裝。而這種代價，往往會在時間維度上留下痕跡。

如果一個人長年對某個議題高度投入，突然在某個關鍵時期完全沉默，然後又突然恢復高強度參與。這種時間模式本身就在說話。

▉ 從紙面到現場：登門驗證

最後，Carreyrou 去敲了他的門。

文章裡沒有給出承認。這不意外。終局答案從來都不在那個場景裡。

好的調查不是「我有一堆資料」，而是「我願意把資料放到對方可反駁的場景」。作者敲那扇門，不只是為了得到答案。反而是去測試那個人說話的方式，測試他如何繞過某個問題，測試那些話語背後的微小震顫。這些也是證據。

就像科學實驗：結果不一定給出答案，但會告訴你假說的哪個部分需要修正。面對對質時的回應模式本身，也是證據的一部分。

▉ 證據鏈的層次分析

讀完這篇文章，我們嘗試用以下框架來評估證據強度：

第一層：語言習慣

拼寫混用模式高度吻合
連字號錯誤重合度遠超第二名（67 vs 38）
標點與句式習慣一致
強度：高

第二層：時間軸模式

出現—消失—再出現的節奏符合「有意識隱藏」的假說
在關鍵時期的異常沉默難以用巧合解釋
強度：中高

第三層：社群背景

密碼學郵件列表的參與者身份完全對得上
技術能力足以設計比特幣系統
強度：中（必要條件，但非充分條件）

第四層：自證

缺少決定性的加密學簽名驗證
當事人未承認
強度：無

如果必須給一個概率，這會是「比隨機高很多，但還不到法律級證明」。這不是因為證據不夠強，而是因為問題本身的約束條件：終局證明需要當事人自證，而這件事可能永遠不會發生。

▉ 什麼是「身份證明」？

這篇文章其實觸及了一個深刻的問題：在數位時代，什麼是「身份證明」？

傳統上，我們認為身份證明需要有法律或是生物上的決定性：護照、指紋、DNA、密碼學簽名。但這篇文章展示了另一種可能性：身份證明可以是「概率性的」，是由多個弱證據收斂而成的一個「足夠可信」的結論。

有趣的是，這篇文章探討的「身份證明」問題，其實和比特幣本身的「交易證明」問題形成了某種對應。

比特幣用工作量證明解決了「誰擁有這筆錢」的問題，而不需要中心化的權威機構。而這篇調查報導，嘗試用「證據鏈證明」來解決「誰是中本聰」的問題，也不依賴當事人的自證。

▉ 結語

謎題本身可能永遠不會有終局，但追尋謎題的方式，本身就是一種終局與有趣之處。

閱讀 John Carreyrou 破解比特幣最大謎團之心得

閱讀 John Carreyrou 破解比特幣最大謎團之心得

Tags

我們說的話，決定了我們能看見什麼

城市與野心（續）