Dados on-chain são informações registadas numa blockchain. Sendo a blockchain uma base de dados distribuída, estes dados são públicos e acessíveis por qualquer pessoa.
A Web3 e a web2 representam versões distintas da World Wide Web, sendo a Web3 a mais recente e avançada. Entre as principais diferenças destacam-se:
A Web3 é descentralizada, enquanto a web2 é centralizada. Na Web3, dados e serviços são fornecidos por uma rede distribuída de nós, não por uma única entidade. Tal torna a Web3 mais resiliente e menos vulnerável à censura ou falhas, mas também mais complexa e difícil de controlar.
A Web3 assenta na tecnologia blockchain, enquanto a web2 utiliza uma arquitetura cliente-servidor tradicional. Na Web3, os dados são armazenados e transferidos com recurso a algoritmos criptográficos e não por um servidor central. Isto confere à Web3 maior segurança e transparência, embora seja mais lenta e dispendiosa.
A Web3 visa possibilitar novos tipos de aplicações e serviços, enquanto a web2 foca-se em melhorar soluções já existentes. Assim, a Web3 é mais experimental e orientada para o futuro, ao passo que a web2 é mais consolidada e madura.

Estas diferenças influenciam o modo como os dados são analisados em cada contexto. Na Web3, a análise de dados centra-se em entender o funcionamento das redes descentralizadas e da tecnologia blockchain, recorrendo frequentemente a técnicas avançadas como machine learning e análise de redes para identificar padrões e tendências. Na web2, a análise foca-se no comportamento dos utilizadores e das aplicações, utilizando métodos tradicionais como análise estatística e visualização de dados para identificar tendências e perspetivas.
Para analisar dados on-chain, é necessário recolher e organizar os dados relevantes, recorrendo depois a ferramentas como visualização de dados e análise estatística para identificar padrões e tendências. Isto permite compreender melhor o funcionamento da rede blockchain e dos seus utilizadores, bem como antecipar a evolução do mercado. Em certos casos, pode recorrer-se a técnicas de machine learning para automatizar a análise e identificar padrões mais complexos.
Existem duas categorias de dados on-chain:
Dados brutos
Abstraídos
Estas categorias são relevantes porque todas as métricas calculadas são abstrações dos dados brutos. Dados on-chain brutos correspondem à informação não processada registada na blockchain, incluindo detalhes de transações individuais como remetente, destinatário e montante transferido. Por sua vez, os dados económicos derivam dos dados brutos e incluem informações sobre oferta e procura de uma criptomoeda, bem como capitalização de mercado e volume de negociação.

Os dados económicos são calculados através de diferentes técnicas e métricas, não sendo meras abstrações dos dados brutos. Por exemplo, a capitalização de mercado resulta da multiplicação da oferta total de uma criptomoeda pelo seu preço atual, enquanto o volume de negociação é obtido pela soma das transações num período determinado. Outras métricas, como a velocidade do dinheiro ou o rácio valor da rede/volume de transações, usam fórmulas mais complexas que consideram fatores como número de transações e atividade da rede.
No geral, os dados económicos oferecem uma visão global do mercado de criptomoedas e são úteis para compreender tendências e apoiar decisões de investimento. Contudo, importa salientar que os dados económicos nem sempre refletem de forma exata ou completa o mercado real, devendo ser analisados com cautela.
Centralização vs descentralização
Existem várias soluções para indexar dados on-chain, tanto centralizadas como descentralizadas. As soluções centralizadas envolvem uma entidade única que recolhe e organiza os dados, enquanto as descentralizadas utilizam uma rede distribuída de nós. Exemplos incluem exploradores de blocos, que permitem pesquisar e navegar na blockchain, e serviços de indexação que disponibilizam APIs e ferramentas para programadores acederem e analisarem dados on-chain.
É possível desenvolver uma solução analítica descentralizada com tecnologia blockchain, dependendo dos requisitos e limitações do sistema. Uma abordagem descentralizada pode garantir maior integridade e segurança dos dados analisados, mas também implica maior complexidade de conceção e implementação, exigindo mais recursos computacionais e de armazenamento. Em termos de desempenho, sistemas descentralizados podem ser mais lentos do que soluções centralizadas, dependendo dos algoritmos, estruturas de dados e arquitetura do sistema. A escolha entre abordagens dependerá das necessidades e objetivos da solução analítica.
Existem diversas metodologias para análise de dados on-chain. Exemplos comuns incluem:
Análise descritiva, que resume e descreve os dados, incluindo o cálculo de estatísticas básicas e geração de visualizações. Este tipo de análise oferece uma visão geral dos dados, facilitando a identificação de padrões e tendências.


Análise exploratória, que implica uma investigação aprofundada dos dados, incluindo técnicas como agrupamento e redução de dimensionalidade. Este tipo de análise permite descobrir padrões e relações ocultas, gerando hipóteses e ideias para investigações futuras.


Análise inferencial, que utiliza técnicas estatísticas para inferir características de uma população com base numa amostra de dados. Aplicam-se métodos para calcular média, mediana, moda, desvio padrão, bem como ferramentas para testar hipóteses e realizar regressões. Este tipo de análise é útil para prever e generalizar a partir dos dados, identificando padrões menos evidentes.


Análise preditiva, que recorre a algoritmos de machine learning para prever eventos ou resultados futuros com base nos dados. Este tipo de análise identifica padrões e tendências, permitindo previsões ou recomendações. Normalmente, incluem-se técnicas como agrupamento, classificação e regressão para identificar relações nos dados.

A metodologia utilizada na análise de dados on-chain depende dos objetivos e requisitos da análise, bem como da natureza dos dados.
A visualização de dados é uma ferramenta analítica frequente que representa dados complexos em formato visual. Inclui gráficos, mapas e tabelas, facilitando a identificação de padrões e tendências. Por exemplo, um gráfico de linhas pode mostrar a evolução do preço de uma criptomoeda ao longo do tempo; um gráfico de barras pode comparar capitalizações de mercado de diferentes criptomoedas. Ferramentas de visualização também permitem criar visualizações interativas, proporcionando exploração aprofundada dos dados em tempo real. Isto revela relações e padrões que podem não ser evidentes nos dados brutos.

Pode perguntar-se: porquê utilizar ferramentas de visualização quando os exploradores já oferecem informação detalhada? Ferramentas de visualização de dados e exploradores de blocos são ambos usados para analisar dados on-chain, mas têm funções distintas e fornecem tipos de informação diferentes.

Ferramentas de visualização de dados concentram-se na apresentação visual dos dados, facilitando a compreensão e identificação de padrões e tendências. Já os exploradores de blocos são plataformas online que permitem navegar na blockchain e consultar detalhes sobre blocos, transações e endereços. Oferecem uma interface intuitiva para aceder e interagir com os dados, mas geralmente não incluem funcionalidades avançadas de análise ou visualização. Em regra, a combinação de ferramentas de visualização com exploradores de blocos permite uma compreensão mais profunda dos dados blockchain.
Ao abordar o futuro da Web3 e da ciência de dados, há quatro pontos essenciais:
A Web3 irá criar mais oportunidades profissionais para cientistas de dados e especialistas em dados. Organizações que planeiam adotar a Web3 necessitarão de profissionais experientes em análise, interpretação e desenvolvimento de produtos e serviços baseados em dados, integrando IA e ML.

Utilizadores e cientistas de dados beneficiarão financeiramente da Web3. As empresas poderão comprar dados diretamente aos utilizadores (permitindo aos detentores de dados vendê-los livremente), combinar estes novos conjuntos com dados existentes para melhorar modelos de aprendizagem, e vender as novas perspetivas no mercado aberto.
Cientistas de dados podem aplicar IA para compreender melhor as necessidades individuais dos clientes na Web3. Empresas de dados podem criar modelos linguísticos para “compreensão semântica”, já que a Web3 é centrada no utilizador e os dados estão ligados à interação individual, permitindo soluções personalizadas. Podem também extrair perspetivas dos dados brutos e transformá-las em recomendações de produtos mais adequadas, melhorando a experiência do cliente segundo as suas expectativas.
Na era da Web3, os cientistas de dados terão um impacto global muito maior. Serão os novos “neurónios”, capazes de criar conteúdos ou modelos de IA que colaboram com outros modelos para resolver problemas complexos ou mitigar riscos para empresas e organizações.