鏈上資料是指記錄於區塊鏈上的資訊。由於區塊鏈屬於分散式資料庫,因此鏈上資料皆為公開,任何人都能自由存取。
Web3 和 Web2 是萬維網的不同世代,其中 Web3 為最新且最先進的版本。兩者的主要差異如下:

這些差異會影響不同環境下的資料分析方式。在 Web3,分析重點在於理解去中心化網路的運作行為與底層區塊鏈技術,通常需運用機器學習、網路分析等先進技術,來發掘資料中的模式與趨勢。Web2 則著重於分析用戶行為及其應用,主要採用統計分析、資料視覺化等傳統工具來了解用戶動態並辨識趨勢。
若要進行鏈上資料分析,需先蒐集並整理相關資料,再運用資料視覺化與統計分析等工具辨識模式與趨勢。這有助於深入掌握區塊鏈網路及用戶行為,並預測市場走向。在某些情境下,也可運用機器學習技術自動化分析流程,進一步發掘更複雜的資料模式。
鏈上資料可分為兩大類:
我們將這兩類區分,是因為所有計算指標本質上都僅是原始資料的抽象化。鏈上原始資料指的是記錄於區塊鏈上的未經處理資訊,包含單筆交易的細節,例如發送者、接收者與轉移的加密貨幣數量。相對地,經濟資料則由原始資料衍生而來,包括特定加密貨幣的供需、市值、交易量等資訊。

經濟資料不只是原始資料的抽象,而是經由各種技術與指標計算產生。例如,市值是以加密貨幣總供應量乘以當前價格得出,交易量則為特定時段內的交易總數。其他指標如貨幣流通速度、網路價值對交易比率等,則需運用更複雜的公式,並考量交易數量及整體網路活動等多項因素。
整體而言,經濟資料有助於用戶從更高層次分析加密貨幣市場,掌握市場趨勢並做出更明智的投資決策。然而須注意,經濟資料未必能完全準確或全面反映基礎市場狀況,使用時應保持審慎。
鏈上資料索引有多種解決方案,包含中心化與去中心化方式。中心化方案通常由單一實體負責資料蒐集與整理,去中心化方案則透過分散式節點網路進行資料索引。常見的索引方案如區塊瀏覽器——讓用戶搜尋、瀏覽區塊鏈,以及索引服務——提供 API 與其他工具,協助開發者存取與分析鏈上資料。
區塊鏈技術可用於打造去中心化分析解決方案,但是否採用仍取決於系統需求與限制。去中心化方式的優點之一,是有助確保被分析資料的完整性與安全性。不過,去中心化系統在設計與實作上更為複雜,並可能需要更多運算與儲存資源。在效能層面,去中心化系統在部分情境下可能較中心化方案緩慢,但這仍視所採演算法、資料結構及整體設計而定。是否選擇去中心化,最終須依據分析方案的實際需求與目標決定。
鏈上資料分析可應用多元方法,包括:
描述性分析負責彙總與描述資料內容,可能包括計算基本統計數值、產生視覺化圖表等。此類分析有助於整體認識資料結構,並協助辨識趨勢與模式。


探索性分析則深入探查資料,包括分群、降維等技術。這有助於發掘資料中隱藏的模式與關聯,並啟發後續研究的假設與創新。


推論性分析則運用統計技術,根據資料樣本對整體進行推論。此類分析會應用各種統計方法,如平均值、中位數、眾數、標準差的計算,以及假設檢定、回歸分析等工具。這有助於預測和概括資料內容,並找出不易察覺的趨勢與模式。


預測性分析則運用機器學習演算法,依據資料預測未來事件或結果。此類分析能識別資料中的趨勢與模式,並作為預測或建議依據。常見技術包括分群、分類、回歸等,用以找出資料規律與關聯。

實際用於鏈上資料分析的方法論,會依據分析目標、需求及資料特性而有所不同。
接下來談資料視覺化。資料視覺化是常見分析工具,能將複雜資料以圖表、圖形、地圖等方式直觀呈現,協助辨識資料中的趨勢與模式。例如,折線圖可呈現特定加密貨幣價格隨時間的變化趨勢,條形圖則可比較不同加密貨幣的市值。資料視覺化工具也可建立互動式展示,讓用戶深入探索資料並即時互動,有助於發現原始資料中不易察覺的關聯與模式。

或許有人會問,既然區塊瀏覽器已能提供詳細資訊,為何還要使用視覺化工具?資料視覺化工具與區塊瀏覽器雖同為分析鏈上資料的工具,但兩者用途不同,所呈現的資訊內容也不一樣。

資料視覺化工具專注於將資料以視覺化方式呈現,讓資料更易於理解並辨識趨勢與模式。區塊瀏覽器則是線上工具,讓用戶瀏覽區塊鏈並查詢特定區塊、交易、地址等資訊,提供友善介面以便存取區塊鏈資料,但通常不具備進階分析或視覺化功能。一般而言,資料視覺化工具可與區塊瀏覽器結合,協助更全面掌握區塊鏈資料。
展望 Web3 與資料科學的未來,有四大重點值得關注:
Web3 將為資料科學家及相關專業人士帶來更多就業機會。因為有意導入 Web3 的組織將急需具備經驗的專業人才,能夠活用現有資料進行分析、詮釋與產品開發,並結合人工智慧與機器學習。

用戶與資料科學家將能從 Web3 中獲得經濟收益。企業可選擇直接向用戶購買資料(資料擁有者可自由出售資料),將新資料集與現有資料集結合以優化學習模型,並將新的經驗分析於公開市場販售。
資料科學家可應用人工智慧,更全面掌握 Web3 上特定客戶的需求。資料公司可建立具備語意理解的語言模型,因 Web3 以個人或用戶為中心,資料與用戶活動緊密相連,企業能打造專屬於用戶的解決方案。資料公司也能從原始資料中萃取核心洞見,進而轉化為更優質的產品建議,提升客戶體驗並滿足其期待。
在 Web3 時代,資料科學家對全球經濟的影響力將大幅提升。他們將成為新一代「神經元」,協助創造內容或協同運作的人工智慧模型,並解決更複雜的問題或企業/組織所面臨的潛在風險。