レッスン1

Web3におけるオンチェーンデータ

Web3は、インターネットの次世代として、分散型かつユーザー主導のデータ所有権を実現します。Blockchain技術は、現在のWeb3アプリケーションの多くにおいて基盤となっています。本章では、オンチェーンデータの定義と分類を解説し、その価値を考察した上で、具体的な推奨事項を提示します。

オンチェーンデータとは?

オンチェーンデータは、ブロックチェーン上に記録されるデータを指します。ブロックチェーンは分散型データベースであるため、オンチェーンデータは公開されており、誰でもアクセス可能です。

Web3とWeb2はWorld Wide Webの異なるバージョンであり、Web3が最新かつ高度なバージョンです。両者の主な違いは以下の通りです。

  1. Web3は分散型で、Web2は中央集権型です。Web3ではデータやサービスが分散ネットワークのノードによって提供され、単一の組織による管理ではありません。そのため、Web3は耐障害性・検閲耐性が高いものの、複雑で制御が難しくなります。

  2. Web3はブロックチェーン技術上に構築され、Web2は従来のクライアント・サーバー型アーキテクチャを採用しています。Web3では暗号アルゴリズムによってデータの保存・転送が行われ、中央サーバーによる管理はありません。これにより、Web3はセキュリティと透明性が高まりますが、処理速度が遅くなり、コストも増加します。

  3. Web3は新しいタイプのアプリケーションやサービスの創出に重点を置き、Web2は既存のアプリケーションやサービスの改善に重点を置いています。Web3はより実験的かつ先進的であり、Web2は成熟し確立されています。

これらの違いは、各環境でのデータ分析方法にも影響します。Web3では分散型ネットワークやブロックチェーン技術の挙動を理解することが重視され、機械学習やネットワーク分析などの高度な手法によってデータのパターンや傾向を特定します。Web2ではユーザーやアプリケーションの挙動の理解に重点が置かれ、統計分析やデータ可視化などの従来手法によってユーザー行動や傾向・洞察を把握します。

オンチェーンデータ分析を行うには、関連データの収集・整理後、データ可視化や統計分析などのツール・技術を用いてパターンや傾向を抽出します。これにより、ブロックチェーンネットワークやユーザーの挙動を深く理解し、市場の将来動向を予測できます。場合によっては機械学習技術を活用し、分析プロセスの自動化や複雑なパターンの発見も可能です。

オンチェーンデータの分類

オンチェーンデータは、以下の2つのカテゴリに分類されます:

  1. 生データ

  2. 抽象化データ

このような分類を設けるのは、計算された指標はすべて生データの抽象化に過ぎないためです。オンチェーンの生データは、ブロックチェーン上に記録される未加工のデータであり、個々の取引の送信者・受信者・送金額などの情報が含まれます。一方、経済データは生データから導出され、特定暗号資産の需給、時価総額、取引量などの情報を含みます。

経済データは生データの単なる抽象化ではなく、様々な手法や指標を用いて計算されます。例えば、時価総額は暗号資産の総供給量に現在の価格を掛けて算出され、取引量は一定期間内の全取引数の合計で算出されます。マネーの回転率やネットワーク価値対取引比率など、取引数やネットワーク活動量など複数要素を考慮した複雑な計算式も存在します。

経済データは暗号資産市場の高次の視点を提供し、市場動向の把握や投資判断に役立ちます。ただし、経済データが必ずしも市場の実態を正確・完全に反映するものではないため、利用時は注意が必要です。

分析ソリューションの種類

中央集権型 vs 分散型

オンチェーンデータのインデックス化には、中央集権型と分散型の両方のソリューションがあります。中央集権型は単一の組織がデータを収集・整理し、分散型は分散ネットワークのノードがデータをインデックス化します。インデックス化の例として、ブロックエクスプローラー(ユーザーがブロックチェーンを検索・閲覧できる)や、開発者向けAPIなどのツールを提供するインデックスサービスがあります。

ブロックチェーン技術を用いた分散型分析ソリューションの構築も可能ですが、これはシステムの要件や制約によります。分散型アプローチの利点は、分析対象データの完全性やセキュリティの確保です。ただし、分散型システムは設計・実装が複雑になり、計算資源やストレージなど追加リソースが必要となる場合があります。性能面では、分散型は中央集権型よりも遅くなる場合もありますが、これはアルゴリズムやデータ構造、システム設計によって異なります。最終的な選択は、分析ソリューションの目的やニーズに依存します。

ブロックチェーンデータでできること

オンチェーンデータ分析には、さまざまな手法が活用できます。主な例は以下の通りです。

記述的分析

記述的分析は、データの要約や記述を行い、基本的な統計量の算出や可視化の生成などが含まれます。データの全体像把握や傾向・パターンの特定に有効です。


探索的分析

探索的分析は、データの深い探索を行い、クラスタリングや次元削減などが含まれます。データ内の隠れたパターンや関係性の発見、さらなる調査のための仮説やアイデアの生成に役立ちます。


推論的分析

推論的分析は、統計手法を用いてデータのサンプルから母集団について推論します。平均値・中央値・最頻値・標準偏差の算出や、仮説検定・回帰分析などが活用されます。データの予測や一般化、すぐには分からない傾向やパターンの特定に有効です。


予測的分析

予測的分析は、機械学習アルゴリズムを用いてデータから将来の事象や結果を予測します。クラスタリング・分類・回帰などの手法でパターンや関係性を特定し、予測や推奨を行います。

オンチェーンデータ分析の具体的な手法は、分析の目的・要件・データの性質によって異なります。

データ可視化は、複雑なデータを視覚的に表現するための分析ツールです。チャート・グラフ・地図などを活用し、データの傾向やパターンを特定できます。例えば、折れ線グラフで暗号資産の価格推移を表示したり、棒グラフで異なる暗号資産の時価総額を比較したりできます。インタラクティブな可視化を作成することで、ユーザーがデータを深く探索し、リアルタイムで操作できます。これにより、生データだけでは分かりにくい関係性やパターンも明らかになります。

「エクスプローラーで網羅的な情報が得られるのに、なぜ可視化ツールが必要なのか?」という疑問もあるでしょう。データ可視化ツールとブロックエクスプローラーは、どちらもオンチェーンデータ分析に利用できますが、目的や提供情報が異なります。

データ可視化ツールはデータを視覚的に表現し、傾向やパターンの把握を容易にします。一方、ブロックエクスプローラーはブロックチェーン上の特定ブロック・取引・アドレスなどの情報を閲覧できるオンラインツールです。データへのアクセスや操作性は高いですが、高度な分析や可視化機能は通常ありません。一般的には、データ可視化ツールとブロックエクスプローラーを組み合わせて活用することで、ブロックチェーンデータをより包括的に理解できます。

Web3・データサイエンス・就業機会

Web3とデータサイエンスの未来を考える際、4つのポイントがあります。

Web3は、データサイエンティストやデータ専門職の雇用機会を拡大します。Web3導入を目指す組織は、データ分析・解釈・AIや機械学習を活用した製品・サービス開発に豊富な経験を持つ人材を必要とするためです。

Web3は、ユーザーとデータサイエンティスト双方に経済的メリットをもたらします。企業はユーザーから直接データを購入できるようになり(データ所有者が自由にデータを販売できる)、既存データセットと新しいデータセットを組み合わせて学習モデルを改善し、その新たな洞察をオープンマーケットで販売できます。

データサイエンティストは、Web3上でAIを活用し、特定顧客のニーズをより深く理解できます。Web3はユーザー中心であり、データがユーザーの行動と紐づいているため、データ企業は「意味理解」をもたらす言語モデルを構築し、ユーザーごとに最適化されたソリューションを提供できます。また、生データから洞察を抽出し、それをより良い製品推奨へと転換し、顧客体験を向上させることも可能です。

Web3時代では、データサイエンティストの世界経済への影響が大幅に拡大します。彼らは新たな「ニューロン」として、他のAIモデルと連携し、企業や組織が直面する複雑な課題やリスクの解決に貢献します。

免責事項
* 暗号資産投資には重大なリスクが伴います。注意して進めてください。このコースは投資アドバイスを目的としたものではありません。
※ このコースはGate Learnに参加しているメンバーが作成したものです。作成者が共有した意見はGate Learnを代表するものではありません。