如何正确解读链上数据及地址标签
是鹅好甜
发表于 2022-12-10 21:26:21
109
0
0
先贴几个FUD事实:7 @$ _# B1 X) _
" s, c( @+ U- g3 N5 k# C
1)Dragonfly转入Binance PERP要出货,高点买,低点卖被解读为机构被割韭菜,但事实没有人能证明Dragonfly的买单价同步于二级市场;
' ~* ~) K6 D* ~7 _: U8 k# j- l8 O
2)Amber co-founder TTK接收公司5000ETH,被指中饱私囊,但其实地址标签可能存在错误。 类似的消息,每天有很多,链上数据真能佐证FUD的事实吗?
O3 ?7 L @' {2 ^' a) ~; P( f# F
事实上链上数据的每一次 Transfer Event是客观存在的,但涉及到交易所地址标签,大户个人标签,机构地址标签等链下Entity标签却未必100%精确。因为地址标签都是链下属性,交易所等真实的地址标签并没有完全披露。 要完全挖掘需要用算法推演,线下证实等社会化工程,只能接近事实,但难真正划等号。0 I9 T F/ Q& n
' e( A1 G! k" W4 y, @
先来说Address lables,现在各大浏览器和数据服务平台,基于UTXO特性的Common Spending 和One-Time-Change等技术原理来追溯,搜集了数以亿级的Entity地址标签。此外,交易所地址、矿池地址、Mixer洗钱地址、博彩赌博地址等都有不同的业务特性,可区别建模甄别,比如,矿工地址收款没有input来源。( q: Y1 S/ m2 \8 V
何为Common Spending:简单来说,如果一笔 (BTC) 交易同时有多个输入地址,那么就可以认定这些输入地址是由同一个Entity控制。我们可以通过提取交易所用户的充值种子地址不断辐射,通过上下层追溯挖掘更多的关联新地址,再根据地址之间的互动,归类冷、热等钱包,进而囤积越来越多的labels。
无论如何这些标签都是第三方通过技术手段推算而来,如果交易所高频率更换种子地址,或者有意用混币mixer手段遮掩地址,这样已有的地址标签也会失效。Common Spending推论地址标签的准确性取决于Entity的种子地址数和其更换频率,可以反侦察。只是因为交易所也要在各地搞合规,没必要这样做。+ ?" H3 |; ?% u# j; e
而且交易所的业务场景很复杂,单纯看链上数据很难揣测背后意图:1)交易所冷热钱包大额转账,可能是钱包归集整理;2)交易所Entity之间大额互转,可能只是大户提币;3)交易所地址资金流入未知地址,可能是提币也可能是同一主体钱包整理;这些动态可辅佐分析,但推论跑路、砸盘等人为原因不够严谨。其实,安全和数据公司一开始搜集地址标签的本意,主要为了服务AML资产追踪业务,在黑客洗钱时能够第一时间协助警察,进行技术取证,让赃款能被有效封堵。由于黑客大都会采用干净的新地址,且黑客洗钱需要依赖CEX的交易深度,链上数据异动在资产追踪业务场景下的预警意义才最大。
& Q9 ]" \3 [$ S3 x/ O# s7 |% |# x# u
现在很多链上Alert机器人每天都会发送各类大额转账和涉及Entity的转账交易,大家能及时捕捉并响应,是会避开一些风险。但不排除个别数据被错误或扩大解读,这带来的市场Fomo和挤兑影响,也会真实波及每个人的资产。 如何客观理性解读数据,对数据预警公司、媒体、以及FUD中的每个人都是挑战。
补充:虽然只想用心科普,并不想针对谁,但是某个 @lookonchain 的数据分析平台,已经带头制造了多次FUD,请做有态度的Builder OK?不过,乐观来看,随着链上数据挖掘产业的成熟,捕风捉影的过度数据解读也一并会成为历史。 @nansen @0xscope @DuneAnalytics 。
成为第一个吐槽的人