Урок 1

Ончейн-дані у Web3

Web3 — це наступне покоління Інтернету, яке базується на децентралізованому підході та контролі даних з боку користувачів. Технологія блокчейн є фундаментом для багатьох сучасних застосунків Web3. У цьому розділі подано визначення і класифікацію ончейн-даних, проаналізовано їхню цінність і запропоновано практичні рекомендації.

Що таке ончейн-дані?

Ончейн-дані — це інформація, записана у блокчейні. Оскільки блокчейн — це розподілена база даних, ончейн-дані є публічними й доступні для всіх.

Web3 і web2 — це різні покоління Всесвітньої павутини. Web3 — найновіша й технологічно просунута версія. Основні відмінності між ними такі:

  1. Web3 децентралізований, а web2 централізований. У web3 дані й сервіси забезпечує розподілена мережа вузлів, а не окрема організація. Це підвищує стійкість системи, зменшує ризик цензури та збоїв, але робить web3 складнішим для управління.

  2. Web3 працює на технології блокчейну, а web2 — на класичній клієнт-серверній архітектурі. У web3 дані зберігаються й передаються за допомогою криптографічних алгоритмів, а не централізованого сервера. Це забезпечує більшу безпеку й прозорість, але може впливати на швидкість і вартість операцій.

  3. Web3 орієнтується на створення нових типів застосунків і сервісів, тоді як web2 вдосконалює вже існуючі. Тому web3 більш експериментальний і інноваційний, а web2 — зрілий і стабільний.

Ці відмінності визначають підходи до аналізу даних у кожному середовищі. В web3 аналіз зосереджений на вивченні поведінки децентралізованих мереж і блокчейн-технологій. Тут застосовують сучасні методи, як-от машинне навчання та мережевий аналіз, для виявлення закономірностей і трендів. У web2 аналіз даних спрямований на вивчення поведінки користувачів і застосунків. Для цього використовують класичні статистичні методи й засоби візуалізації для пошуку трендів та інсайтів.

Для аналізу ончейн-даних потрібно зібрати й впорядкувати релевантну інформацію, а потім застосувати інструменти візуалізації й статистичного аналізу для виявлення закономірностей і трендів. Це допоможе краще зрозуміти поведінку мережі блокчейн і її користувачів, а також робити прогнози щодо розвитку ринку. У певних випадках можна використовувати машинне навчання для автоматизації аналізу й пошуку складних закономірностей у даних.

Категорії ончейн-даних

Ончейн-дані поділяються на дві категорії:

  1. Сирі дані

  2. Абстраговані дані

Таке розділення важливе, оскільки всі обчислювані метрики є абстракціями на основі сирих даних. Ончейн сирі дані — це необроблена інформація, що фіксується у блокчейні. Вона містить дані про окремі транзакції — відправника, отримувача та суму криптовалюти, що була передана. Економічні дані, навпаки, отримують із сирих даних і включають інформацію про попит і пропозицію криптовалюти, її ринкову капіталізацію та обсяг торгів.

Економічні дані — це не просто абстракція над сирими даними, а результат обробки з використанням різних методик і метрик. Наприклад, ринкову капіталізацію розраховують множенням загальної пропозиції криптовалюти на її поточну ціну, а обсяг торгів — підсумовуванням кількості транзакцій за певний період. Інші метрики, такі як швидкість обігу грошей чи співвідношення вартості мережі до обсягу транзакцій, розраховують за складнішими формулами з урахуванням різних факторів, наприклад кількості транзакцій і загальної мережевої активності.

Загалом економічні дані дають змогу отримати узагальнену картину ринку криптовалют і можуть бути корисними для аналізу ринкових трендів і ухвалення інвестиційних рішень. Водночас варто пам’ятати, що економічні дані не завжди повністю чи точно відображають реальний стан ринку, тому їх слід використовувати з обережністю.

Різні аналітичні рішення

Централізація та децентралізація

Для індексації ончейн-даних існують централізовані й децентралізовані рішення. Централізовані системи передбачають, що одна організація збирає й структурує дані, а децентралізовані — використовують мережу вузлів для індексації. Серед прикладів рішень — блокчейн-оглядачі, які дозволяють шукати й переглядати блокчейн, а також сервіси індексації, що надають API та інші інструменти для розробників для доступу й аналізу ончейн-даних.

Децентралізоване аналітичне рішення можна створити на основі блокчейну, але це залежить від конкретних вимог і обмежень системи. Перевагою децентралізованого підходу є збереження цілісності й безпеки даних, що аналізуються. Водночас такі системи складніші у розробці й впровадженні, а також потребують більше обчислювальних і дискових ресурсів. Щодо продуктивності, децентралізована система може працювати повільніше за централізовану — усе залежить від алгоритмів, структур даних і архітектури. Остаточний вибір підходу визначається потребами й цілями аналітичного рішення.

Що можна робити з блокчейн-даними?

Для аналізу ончейн-даних застосовують різні методології. Основні приклади:

Дескриптивний аналіз

Дескриптивний аналіз — це підсумовування й опис даних, зокрема розрахунок базових статистичних показників і створення візуалізацій. Він допомагає отримати загальне уявлення про дані, виявити тренди й закономірності.


Експлораторний аналіз

Експлораторний аналіз — це детальне дослідження даних, яке включає методи кластеризації та зниження розмірності. Такий аналіз дає змогу виявити приховані закономірності й зв’язки, а також сформулювати гіпотези для подальшого дослідження.


Інференційний аналіз

Інференційний аналіз використовує статистичні методи для висновків щодо всієї сукупності за вибіркою даних. Для цього застосовують розрахунок середнього, медіани, моди, стандартного відхилення, а також перевірку гіпотез і регресійний аналіз. Це підходить для прогнозування, узагальнення даних і пошуку неочевидних закономірностей.


Прогностичний аналіз

Прогностичний аналіз використовує алгоритми машинного навчання для передбачення майбутніх подій або результатів на основі даних. Такий підхід дає змогу виявити тренди й закономірності, а також робити прогнози чи рекомендації. Зазвичай застосовують кластеризацію, класифікацію й регресію для пошуку зв’язків у даних.

Конкретна методологія аналізу ончейн-даних визначається цілями й вимогами дослідження, а також природою самих даних.

Візуалізація даних — поширений інструмент, який дозволяє представляти складні дані у наочному вигляді. Це можуть бути діаграми, графіки, карти, що допомагають знаходити тренди й закономірності. Наприклад, лінійний графік покаже динаміку ціни криптовалюти, а стовпчикова діаграма — порівняє ринкову капіталізацію різних криптовалют. Інструменти візуалізації також дають змогу створювати інтерактивні графіки для глибшого аналізу й взаємодії з даними в реальному часі. Це дозволяє виявляти зв’язки, які не видно у сирих даних.

Чому використовувати інструменти візуалізації, якщо оглядачі вже надають повну інформацію? Інструменти візуалізації даних і блокчейн-оглядачі — це різні засоби аналізу ончейн-даних, які виконують різні функції й надають різну інформацію.

Інструменти візуалізації даних фокусуються на графічному представленні інформації, що спрощує пошук трендів і закономірностей. Блокчейн-оглядачі — це онлайн-інструменти для перегляду блокчейну, отримання даних про блоки, транзакції й адреси. Вони забезпечують зручний доступ до інформації, але зазвичай не мають розширених функцій аналізу чи візуалізації. Тому для повного розуміння даних у блокчейні доцільно використовувати обидва інструменти разом.

Web3; наука про дані; кар’єрні можливості

Є чотири ключові аспекти для розгляду майбутнього Web3 і науки про дані:

Web3 створить більше робочих місць для дата-сайентістів та інших спеціалістів із даних. Організації, які впроваджують Web3, потребуватимуть фахівців із досвідом у аналізі, інтерпретації даних і розробці продуктів і сервісів із використанням даних, ШІ та машинного навчання.

Користувачі й дата-сайентісти отримають фінансові вигоди від Web3. Компанії зможуть купувати дані безпосередньо у користувачів (даючи їм право продавати свої дані будь-кому), об’єднувати нові й існуючі набори даних для вдосконалення моделей навчання, а потім продавати нові інсайти на відкритому ринку.

Дата-сайентісти зможуть застосовувати ШІ для глибшого розуміння індивідуальних потреб користувачів у Web3. Компанії, що працюють із даними, розроблятимуть мовні моделі для досягнення «семантичного розуміння», оскільки Web3 орієнтований на користувача, а дані пов’язані з його взаємодією. Це дозволяє створювати рішення, персоналізовані під кожного користувача. Також компанії можуть отримувати інсайти із сирих даних і трансформувати їх у кращі рекомендації, що підвищують якість користувацького досвіду відповідно до очікувань клієнта.

У добу Web3 дата-сайентісти матимуть значно більший вплив на світову економіку. Вони стануть «нейронами», які допомагатимуть створювати контент або моделі ШІ, що можуть взаємодіяти з іншими моделями й вирішувати складні завдання чи ризики для бізнесу та організацій.

Відмова від відповідальності
* Криптоінвестиції пов'язані зі значними ризиками. Дійте обережно. Курс не є інвестиційною консультацією.
* Курс створений автором, який приєднався до Gate Learn. Будь-яка думка, висловлена автором, не є позицією Gate Learn.