
本系列介紹了錢(qián)包或地址聚類(lèi)背后的基本思想、地址重用的簡(jiǎn)單情況以及基于通用輸入所有權(quán)啟發(fā)式(CIOH)的聚類(lèi)合并(也稱(chēng)為多輸入啟發(fā)式)。
今天,我們將深入探討更復(fù)雜的聚類(lèi)方法,并簡(jiǎn)要總結(jié)幾篇值得關(guān)注的論文。本文內(nèi)容與本系列的姊妹篇《聚類(lèi)分析:聚類(lèi)分析》大部分內(nèi)容相同。需要注意的是,本文引用的文獻(xiàn)列表并非詳盡無(wú)遺。
早期觀察性研究 – 2011-2013
據(jù)我所知,最早發(fā)表的關(guān)于聚類(lèi)的學(xué)術(shù)研究是Fergal Reid和Martin Harrigan的論文()。該論文更廣泛地研究了比特幣的匿名性,并在討論鏈上交易圖時(shí)引入了“用戶網(wǎng)絡(luò)”的概念,基于CIOH來(lái)建模單個(gè)用戶貨幣的關(guān)聯(lián)性。作者利用該模型批判性地審視了維基解密關(guān)于其“……”(此處似有缺失)的說(shuō)法。
另一項(xiàng)未以論文形式發(fā)表的研究是由 Kay Hamacher 和 Stefan Katzenbeisser 在 28c3 上發(fā)表的()。他們利用交易圖數(shù)據(jù)研究了資金流動(dòng),并對(duì)比特幣做出了一些極具預(yù)見(jiàn)性的觀察。
在()中,Dorit Ron 和 Adi Shamir 分析了整個(gè)交易圖的快照。除其他外,他們還注意到一個(gè)奇怪的模式,這可能是顛覆 CIOH 的早期嘗試:
我們發(fā)現(xiàn),幾乎所有這些大額交易都是 2010 年 11 月 8 日發(fā)生的一筆涉及 90,000 比特幣的大額交易的后代,這些交易的子圖包含許多看起來(lái)很奇怪的鏈和分叉合并結(jié)構(gòu),其中大額余額要么在幾個(gè)小時(shí)內(nèi)通過(guò)數(shù)百個(gè)臨時(shí)中間賬戶轉(zhuǎn)移,要么分成許多小額金額,發(fā)送到不同的賬戶,然后不久后在新賬戶中重新組合成基本相同的金額。
另一個(gè)早期混淆此模式的因素是 MtGox。許多用戶的密鑰被用作 MtGox 為處理這種不尋常的存款模式而構(gòu)建的批量清算交易的輸入。對(duì)這些交易的簡(jiǎn)單 CIOH 應(yīng)用導(dǎo)致了集群崩潰,特別是之前在 walletexplorer.com 上稱(chēng)為 CoinJoinMess 的集群。Ron 和 Shamir 似乎也注意到了這一點(diǎn):
然而,這些統(tǒng)計(jì)數(shù)據(jù)存在巨大差異,事實(shí)上,一個(gè)實(shí)體關(guān)聯(lián)著 156,722 個(gè)不同的地址。通過(guò)分析其中一些地址并追蹤其交易,很容易確定該實(shí)體就是 Mt.Gox。
雖然提到了找零識(shí)別(Ron 和 Shamir 將其稱(chēng)為“內(nèi)部”轉(zhuǎn)賬),但首次形式化的嘗試似乎是在 Elli Androulaki、Ghassan O. Karame、Marc Roeschlin、Tobias Scherer 和 Srdjan Capkun 的 () 中。他們使用了“影子地址”一詞,如今更常被稱(chēng)為“找零輸出”。這指的是自支出輸出,通常每筆交易一個(gè),由與包含交易的輸入相同的實(shí)體控制。該論文引入了一種啟發(fā)式方法來(lái)識(shí)別此類(lèi)輸出,并將它們與輸入聚類(lèi)。后續(xù)工作對(duì)這個(gè)想法進(jìn)行了廣泛的迭代,并提出了幾種變體。一個(gè)基于 2 筆輸出交易金額的示例是,如果一個(gè)輸出的值以美元計(jì)價(jià)時(shí)接近整數(shù)(基于歷史匯率),則該輸出很可能是一筆付款,表明另一筆產(chǎn)出就是找零。
在比特幣隱私研究的早期階段,錢(qián)包聚類(lèi)理論已成為比特幣隱私研究的基礎(chǔ)工具。雖然這并非完全基于理論,但證據(jù)支持有限,因此需要相對(duì)嚴(yán)格的假設(shè)來(lái)解釋可觀察到的數(shù)據(jù)。
實(shí)證結(jié)果 – 2013-2017
盡管研究人員試圖驗(yàn)證這些論文的結(jié)論,例如通過(guò)采訪比特幣用戶并要求他們確認(rèn)其錢(qián)包聚類(lèi)的準(zhǔn)確性或使用 Androulaki 等人的研究成果中的模擬,但關(guān)于用戶所使用的對(duì)策的信息卻很少。
(PDF: , )由 Sarah Meiklejohn、Marjori Pomarole、Grant Jordan、Kirill Levchenko、Damon McCoy、Geoffrey M. Voelker 和 Stefan Savage 撰寫(xiě),他們研究了比特幣混合器的使用情況,并通過(guò)將此類(lèi)服務(wù)與真實(shí)比特幣進(jìn)行實(shí)際操作,對(duì)啟發(fā)式方法進(jìn)行了測(cè)試。在理論層面,他們定義了一種比以往研究更通用、更準(zhǔn)確的找零識(shí)別啟發(fā)式方法。
Jonas Nick 在其論文中,利用 BIP 37 布隆過(guò)濾器(主要用于使用 bitcoinj 構(gòu)建的輕客戶端)實(shí)現(xiàn)中一個(gè)隱私漏洞獲取的信息,驗(yàn)證了 CIOH 和更改識(shí)別啟發(fā)式算法。Arthur Gervais、Srdjan Capkun、Ghassan O. Karame 和 Damian Gruber 在 () 中描述了底層隱私泄露問(wèn)題。此次泄露事件表明,聚類(lèi)啟發(fā)式算法相當(dāng)有效,Martin Harrigan 和 Christoph Fretter 在其論文 () 中詳細(xì)闡述了這一發(fā)現(xiàn)。
攻擊者還觀察到,他們發(fā)送比特幣并非通過(guò)像比特幣文件那樣的混合器,而是將少量資金發(fā)送到已在鏈上出現(xiàn)的地址。這種行為被稱(chēng)為粉塵攻擊,可以通過(guò)兩種方式使受害者失去匿名性。首先,接收方錢(qián)包可能會(huì)花費(fèi)這些資金,從而導(dǎo)致地址重用。其次,舊版本的比特幣核心會(huì)重新廣播收到的交易,因此,如果攻擊者同時(shí)連接到 p2p 網(wǎng)絡(luò)上的多個(gè)節(jié)點(diǎn),就可以觀察到是否有任何節(jié)點(diǎn)正在將其粉塵交易及其 IP 地址重新廣播到集群。
盡管 Matteo Loporchio、Anna Bernasconi、Damiano Di Francesco Maesa 和 Laura Ricci 在 2023 年提出的 () 提出了一些見(jiàn)解,探討了粉塵攻擊,但他們分析的數(shù)據(jù)集僅延伸到 2017 年。這項(xiàng)研究研究了此類(lèi)攻擊在揭示集群方面的有效性:
這意味著,盡管粉塵攻擊交易僅占所有粉塵攻擊交易的 4.86%,但卻能將 66.43% 的粉塵攻擊聚集地址聚類(lèi)。從整個(gè)數(shù)據(jù)集來(lái)看,疑似粉塵攻擊的交易僅占所有交易的 0.008%,但卻能將 0.14% 的原本可能被隔離的地址聚類(lèi)。
這一時(shí)期的研究以對(duì)錢(qián)包聚類(lèi)理論的更批判性審視為標(biāo)志。越來(lái)越明顯的是,在某些情況下,用戶的行為可以被輕松可靠地觀察到,而且隱私保障遠(yuǎn)非完美,這不僅在理論上,而且基于越來(lái)越多的科學(xué)證據(jù)。
錢(qián)包指紋識(shí)別 – 2021-2024
錢(qián)包指紋是交易數(shù)據(jù)中可識(shí)別的模式,可能指示用戶使用特定的錢(qián)包軟件。近年來(lái),研究人員已將錢(qián)包指紋識(shí)別技術(shù)應(yīng)用于錢(qián)包聚類(lèi)。單個(gè)錢(qián)包聚類(lèi)通常使用同一款軟件創(chuàng)建,因此任何可觀察到的指紋在聚類(lèi)中都應(yīng)該相當(dāng)一致。
舉一個(gè)錢(qián)包指紋識(shí)別的簡(jiǎn)單例子,每筆交易都有一個(gè) nLockTime 字段,可用于設(shè)置交易的回溯時(shí)間。這可以通過(guò)指定高度或時(shí)間來(lái)實(shí)現(xiàn)。當(dāng)不需要設(shè)置回溯時(shí)間時(shí),可以使用任何表示過(guò)去時(shí)間點(diǎn)的值,通常為 0,但此類(lèi)交易在簽名時(shí)尚未設(shè)置回溯時(shí)間。為了避免泄露預(yù)期行為并解決這一問(wèn)題,一些錢(qián)包會(huì)隨機(jī)指定一個(gè)較新的 nLockTime 值。然而,由于一些錢(qián)包始終將 nLockTime 指定為 0,因此當(dāng)無(wú)法明確交易的哪些輸出是付款、哪些是找零時(shí),后續(xù)交易可能會(huì)泄露這些信息。例如,假設(shè)與輸入幣關(guān)聯(lián)的所有交易都將 nLockTime 指定為 0,但其中一個(gè)輸出的支出交易未指定,在這種情況下,可以合理地推斷該輸出是向其他用戶的付款。
還有許多其他已知指紋。Ishaana Misra 撰寫(xiě)的記錄十分全面。
Malte M?ser 和 Arvind Narayanan () 將指紋識(shí)別技術(shù)應(yīng)用于聚類(lèi)問(wèn)題。他們以此為基礎(chǔ),對(duì)變更識(shí)別方法進(jìn)行了改進(jìn)。他們利用指紋識(shí)別技術(shù),使用機(jī)器學(xué)習(xí)技術(shù)(隨機(jī)森林)來(lái)訓(xùn)練和評(píng)估改進(jìn)后的變更識(shí)別方法。
不久之后,George Kappos、Haaroon Yousaf、Rainer Stütz、Sofia Rollet、Bernhard Haslhofer 和 Sarah Meiklejohn 在 () 中擴(kuò)展并驗(yàn)證了該方法,他們使用一家鏈分析公司提供的交易樣本的聚類(lèi)數(shù)據(jù),表明錢(qián)包指紋識(shí)別方法比僅使用 CIOH 和更簡(jiǎn)單的找零識(shí)別啟發(fā)式方法準(zhǔn)確率高得多。在聚類(lèi)時(shí)考慮指紋可以使去匿名化變得更加容易。同樣,在錢(qián)包軟件中考慮指紋識(shí)別可以提高隱私性。
王凱、程亞坤、童文、牛正浩、龐俊和韓偉力最近發(fā)表了一篇論文(),分析了交易在確認(rèn)前廣播的模式。例如,無(wú)論是通過(guò) 還是使用 ,都可以觀察到不同的費(fèi)用上漲行為。這些模式雖然并非嚴(yán)格意義上的交易數(shù)據(jù)指紋,但仍可視為錢(qián)包指紋,但與某些錢(qián)包軟件相關(guān)的更短暫的模式有關(guān),這些模式在連接到比特幣 P2P 網(wǎng)絡(luò)時(shí)可見(jiàn),但在區(qū)塊鏈中記錄的已確認(rèn)交易歷史記錄中卻不明顯。
與比特幣 P2P 層類(lèi)似,閃電網(wǎng)絡(luò)的八卦層會(huì)共享已公開(kāi)宣布的通道信息。這通常不被視為錢(qián)包指紋,但可以大致視為錢(qián)包指紋,與閃電交易的鏈上指紋相輔相成。閃電通道是 UTXO,它們構(gòu)成連接閃電節(jié)點(diǎn)的圖的邊,這些節(jié)點(diǎn)由其公鑰標(biāo)識(shí)。由于一個(gè)節(jié)點(diǎn)可能與多個(gè)通道關(guān)聯(lián),而通道本身就是代幣,因此這在某種程度上類(lèi)似于地址重用。Christian Decker 已公開(kāi)存檔歷史圖數(shù)據(jù)。Matteo Romiti、Friedhelm Victor、Pedro Moreno-Sanchez、Peter Sebastian Nordholt、Bernhard Haslhofer 和 Matteo Maffei 共同撰寫(xiě)了一項(xiàng)研究,探討了此背景下的聚類(lèi)問(wèn)題。
在過(guò)去的十五年里,聚類(lèi)技術(shù)得到了顯著的改進(jìn)。然而,遺憾的是,比特幣隱私技術(shù)的廣泛應(yīng)用仍遠(yuǎn)未實(shí)現(xiàn)。即使實(shí)現(xiàn)了,該軟件在攻擊研究方面也尚未趕上最先進(jìn)的水平。
并非全部
正如我們所見(jiàn),從地址重用和中本聰描述的CIOH的雛形開(kāi)始,錢(qián)包集群一直是比特幣隱私的基礎(chǔ)理念,多年來(lái)經(jīng)歷了諸多發(fā)展。大量學(xué)術(shù)文獻(xiàn)對(duì)比特幣隱私的一些過(guò)于樂(lè)觀的描述提出了質(zhì)疑,例如2011年維基解密將捐贈(zèng)描述為匿名。此外,還有許多進(jìn)一步研究和發(fā)展隱私保護(hù)措施的機(jī)會(huì)。
需要牢記的是,聚類(lèi)技術(shù)只會(huì)隨著時(shí)間的推移而不斷改進(jìn)。“記?。汗糁粫?huì)越來(lái)越厲害,永遠(yuǎn)不會(huì)越來(lái)越糟。” 鑒于區(qū)塊鏈的本質(zhì),交易圖中的模式將或多或少地永久保存,供任何人查閱。使用 Electrum 協(xié)議的輕錢(qián)包會(huì)將地址集群泄露到其 Electrum 服務(wù)器。提交給服務(wù)的輕錢(qián)包會(huì)在一次查詢(xún)中泄露所有過(guò)去和未來(lái)交易的聚類(lèi)信息。鑒于區(qū)塊鏈分析行業(yè)的本質(zhì),專(zhuān)有技術(shù)具有顯著優(yōu)勢(shì),可能受益于獲取標(biāo)記大量交易子集的 KYC 信息。這類(lèi)信息以及其他類(lèi)型的區(qū)塊鏈外部聚類(lèi)信息尤其難以解釋?zhuān)驗(yàn)楸M管這些信息與第三方共享,但并不公開(kāi),這與基于鏈上數(shù)據(jù)的聚類(lèi)不同。因此,這些泄漏不那么容易被發(fā)現(xiàn)。
另外,請(qǐng)記住,個(gè)人隱私的控制權(quán)并非完全掌握在個(gè)人手中。當(dāng)一個(gè)用戶的隱私丟失時(shí),所有其他用戶的隱私都會(huì)隨之降低。通過(guò)消除過(guò)程(隱私衰減呈線性遞增),每個(gè)成功去匿名化的用戶在嘗試去匿名化剩余用戶的交易時(shí),都可能被排除在外。換句話說(shuō),即使你采取了預(yù)防措施來(lái)保護(hù)自己的隱私,如果其他人不采取預(yù)防措施,你也無(wú)法融入到人群中。
然而,正如我們將看到的,假設(shè)隱私呈線性衰減通常過(guò)于樂(lè)觀;指數(shù)衰減是一個(gè)更安全的假設(shè)。這是因?yàn)榉侄沃牟呗砸策m用于錢(qián)包集群,就像在20個(gè)問(wèn)題游戲中一樣。CoinJoins交易旨在混淆CIOH,下一篇文章的主題將是一篇將錢(qián)包集群與交叉攻擊(一個(gè)借鑒自混合網(wǎng)絡(luò)隱私文獻(xiàn)的概念)相結(jié)合的論文,以實(shí)現(xiàn)CoinJoins的去匿名化。
不要與 LaurentMT 和 Antoine Le Calvez 考慮聚類(lèi)因素而進(jìn)行分析的另一種類(lèi)型的粉塵攻擊相混淆。
一個(gè)值得注意的、有點(diǎn)相關(guān)的研究(由 Florian Tramer、Dan Boneh 和 Kenny Paterson 完成)能夠通過(guò)利用 P2P 層上的定時(shí)側(cè)通道將節(jié)點(diǎn) IP 地址鏈接到查看密鑰。
更準(zhǔn)確地說(shuō):指紋分布應(yīng)該在集群內(nèi)保持一致,因?yàn)橛行╁X(qián)包故意隨機(jī)化交易的某些屬性。
請(qǐng)注意,為了強(qiáng)制執(zhí)行 nLockTime,交易中至少一個(gè)輸入的 nSequence 值也必須是非最終的,這使得事后追溯和由此產(chǎn)生的不同可觀察模式變得復(fù)雜。
通道資金由通道雙方共享,但最終交易類(lèi)似于來(lái)自通道出資方的付款。雙資金通道可能會(huì)像交易一樣,混淆CIOH。






.png)





















