Ончейн-дані — це інформація, записана у блокчейні. Оскільки блокчейн — це розподілена база даних, ончейн-дані є публічними й доступні для всіх.
Web3 і web2 — це різні покоління Всесвітньої павутини. Web3 — найновіша й технологічно просунута версія. Основні відмінності між ними такі:
Web3 децентралізований, а web2 централізований. У web3 дані й сервіси забезпечує розподілена мережа вузлів, а не окрема організація. Це підвищує стійкість системи, зменшує ризик цензури та збоїв, але робить web3 складнішим для управління.
Web3 працює на технології блокчейну, а web2 — на класичній клієнт-серверній архітектурі. У web3 дані зберігаються й передаються за допомогою криптографічних алгоритмів, а не централізованого сервера. Це забезпечує більшу безпеку й прозорість, але може впливати на швидкість і вартість операцій.
Web3 орієнтується на створення нових типів застосунків і сервісів, тоді як web2 вдосконалює вже існуючі. Тому web3 більш експериментальний і інноваційний, а web2 — зрілий і стабільний.

Ці відмінності визначають підходи до аналізу даних у кожному середовищі. В web3 аналіз зосереджений на вивченні поведінки децентралізованих мереж і блокчейн-технологій. Тут застосовують сучасні методи, як-от машинне навчання та мережевий аналіз, для виявлення закономірностей і трендів. У web2 аналіз даних спрямований на вивчення поведінки користувачів і застосунків. Для цього використовують класичні статистичні методи й засоби візуалізації для пошуку трендів та інсайтів.
Для аналізу ончейн-даних потрібно зібрати й впорядкувати релевантну інформацію, а потім застосувати інструменти візуалізації й статистичного аналізу для виявлення закономірностей і трендів. Це допоможе краще зрозуміти поведінку мережі блокчейн і її користувачів, а також робити прогнози щодо розвитку ринку. У певних випадках можна використовувати машинне навчання для автоматизації аналізу й пошуку складних закономірностей у даних.
Ончейн-дані поділяються на дві категорії:
Сирі дані
Абстраговані дані
Таке розділення важливе, оскільки всі обчислювані метрики є абстракціями на основі сирих даних. Ончейн сирі дані — це необроблена інформація, що фіксується у блокчейні. Вона містить дані про окремі транзакції — відправника, отримувача та суму криптовалюти, що була передана. Економічні дані, навпаки, отримують із сирих даних і включають інформацію про попит і пропозицію криптовалюти, її ринкову капіталізацію та обсяг торгів.

Економічні дані — це не просто абстракція над сирими даними, а результат обробки з використанням різних методик і метрик. Наприклад, ринкову капіталізацію розраховують множенням загальної пропозиції криптовалюти на її поточну ціну, а обсяг торгів — підсумовуванням кількості транзакцій за певний період. Інші метрики, такі як швидкість обігу грошей чи співвідношення вартості мережі до обсягу транзакцій, розраховують за складнішими формулами з урахуванням різних факторів, наприклад кількості транзакцій і загальної мережевої активності.
Загалом економічні дані дають змогу отримати узагальнену картину ринку криптовалют і можуть бути корисними для аналізу ринкових трендів і ухвалення інвестиційних рішень. Водночас варто пам’ятати, що економічні дані не завжди повністю чи точно відображають реальний стан ринку, тому їх слід використовувати з обережністю.
Централізація та децентралізація
Для індексації ончейн-даних існують централізовані й децентралізовані рішення. Централізовані системи передбачають, що одна організація збирає й структурує дані, а децентралізовані — використовують мережу вузлів для індексації. Серед прикладів рішень — блокчейн-оглядачі, які дозволяють шукати й переглядати блокчейн, а також сервіси індексації, що надають API та інші інструменти для розробників для доступу й аналізу ончейн-даних.
Децентралізоване аналітичне рішення можна створити на основі блокчейну, але це залежить від конкретних вимог і обмежень системи. Перевагою децентралізованого підходу є збереження цілісності й безпеки даних, що аналізуються. Водночас такі системи складніші у розробці й впровадженні, а також потребують більше обчислювальних і дискових ресурсів. Щодо продуктивності, децентралізована система може працювати повільніше за централізовану — усе залежить від алгоритмів, структур даних і архітектури. Остаточний вибір підходу визначається потребами й цілями аналітичного рішення.
Для аналізу ончейн-даних застосовують різні методології. Основні приклади:
Дескриптивний аналіз — це підсумовування й опис даних, зокрема розрахунок базових статистичних показників і створення візуалізацій. Він допомагає отримати загальне уявлення про дані, виявити тренди й закономірності.


Експлораторний аналіз — це детальне дослідження даних, яке включає методи кластеризації та зниження розмірності. Такий аналіз дає змогу виявити приховані закономірності й зв’язки, а також сформулювати гіпотези для подальшого дослідження.


Інференційний аналіз використовує статистичні методи для висновків щодо всієї сукупності за вибіркою даних. Для цього застосовують розрахунок середнього, медіани, моди, стандартного відхилення, а також перевірку гіпотез і регресійний аналіз. Це підходить для прогнозування, узагальнення даних і пошуку неочевидних закономірностей.


Прогностичний аналіз використовує алгоритми машинного навчання для передбачення майбутніх подій або результатів на основі даних. Такий підхід дає змогу виявити тренди й закономірності, а також робити прогнози чи рекомендації. Зазвичай застосовують кластеризацію, класифікацію й регресію для пошуку зв’язків у даних.

Конкретна методологія аналізу ончейн-даних визначається цілями й вимогами дослідження, а також природою самих даних.
Візуалізація даних — поширений інструмент, який дозволяє представляти складні дані у наочному вигляді. Це можуть бути діаграми, графіки, карти, що допомагають знаходити тренди й закономірності. Наприклад, лінійний графік покаже динаміку ціни криптовалюти, а стовпчикова діаграма — порівняє ринкову капіталізацію різних криптовалют. Інструменти візуалізації також дають змогу створювати інтерактивні графіки для глибшого аналізу й взаємодії з даними в реальному часі. Це дозволяє виявляти зв’язки, які не видно у сирих даних.

Чому використовувати інструменти візуалізації, якщо оглядачі вже надають повну інформацію? Інструменти візуалізації даних і блокчейн-оглядачі — це різні засоби аналізу ончейн-даних, які виконують різні функції й надають різну інформацію.

Інструменти візуалізації даних фокусуються на графічному представленні інформації, що спрощує пошук трендів і закономірностей. Блокчейн-оглядачі — це онлайн-інструменти для перегляду блокчейну, отримання даних про блоки, транзакції й адреси. Вони забезпечують зручний доступ до інформації, але зазвичай не мають розширених функцій аналізу чи візуалізації. Тому для повного розуміння даних у блокчейні доцільно використовувати обидва інструменти разом.
Є чотири ключові аспекти для розгляду майбутнього Web3 і науки про дані:
Web3 створить більше робочих місць для дата-сайентістів та інших спеціалістів із даних. Організації, які впроваджують Web3, потребуватимуть фахівців із досвідом у аналізі, інтерпретації даних і розробці продуктів і сервісів із використанням даних, ШІ та машинного навчання.

Користувачі й дата-сайентісти отримають фінансові вигоди від Web3. Компанії зможуть купувати дані безпосередньо у користувачів (даючи їм право продавати свої дані будь-кому), об’єднувати нові й існуючі набори даних для вдосконалення моделей навчання, а потім продавати нові інсайти на відкритому ринку.
Дата-сайентісти зможуть застосовувати ШІ для глибшого розуміння індивідуальних потреб користувачів у Web3. Компанії, що працюють із даними, розроблятимуть мовні моделі для досягнення «семантичного розуміння», оскільки Web3 орієнтований на користувача, а дані пов’язані з його взаємодією. Це дозволяє створювати рішення, персоналізовані під кожного користувача. Також компанії можуть отримувати інсайти із сирих даних і трансформувати їх у кращі рекомендації, що підвищують якість користувацького досвіду відповідно до очікувань клієнта.
У добу Web3 дата-сайентісти матимуть значно більший вплив на світову економіку. Вони стануть «нейронами», які допомагатимуть створювати контент або моделі ШІ, що можуть взаємодіяти з іншими моделями й вирішувати складні завдання чи ризики для бізнесу та організацій.