O Claude Code conquista o primeiro lugar na maratona de hackers com investigação de automação! Vencedor: eu nem sequer sabia como vencer

No Hackathon de Autoresearch organizado pela Paradigm, um(a) participante que, praticamente, não “concebeu estratégias pessoalmente”, acabou por vencer o torneio. O vencedor Ryan Li, que também é CEO da SurfAI, afirma que todo o processo de resolução ficou quase totalmente a cargo da IA, que ele próprio “nem sabe como é que venceu”, e ainda assim conseguiu o primeiro lugar no Prediction Market Challenge.

Esta competição exige que os participantes desenhem uma estratégia de market making num mercado de previsão binário simulado, fornecendo liquidez no livro de ordens através de ordens limitadas e equilibrando o lucro entre “arbitradores” e o fluxo de retalho. A classificação final é calculada com base na edge média (vantagem de lucro) em 200 simulações aleatórias. O resultado final de Ryan foi de 42,32 USD de mean edge (calculado pela mediana de três grupos de sementes aleatórias) e, após a reavaliação, subiu ao primeiro lugar.

Claude Code + Codex pesquisa automática, produz 1.039 estratégias

Ao contrário das estratégias de trading quantitativo tradicional ou de market making que dependem de ajustes e modelação por especialistas humanos, Ryan adoptou a abordagem do “Bitter Lesson” proposta por Rich Sutton nos últimos anos, fazendo com que a capacidade de computação e o tamanho da pesquisa superem a experiência humana. Ele transformou todo o problema num processo de “pesquisa automatizada” (autoresearch), explorando em paralelo o espaço de possíveis soluções por meio de múltiplos agentes de IA, em vez de optimização manual.

Durante todo o processo, ele utilizou entre 8 e 20 agentes de IA em execução paralela (principalmente com base em Claude Code, com apoio do Codex). Cada agente ficou responsável por diferentes hipóteses e espaços de parâmetros, gerando continuamente estratégias, executando simulações e devolvendo os resultados. No fim, acumulou a produção de 1.039 variações de estratégias, realizou mais de 2.000 avaliações e gerou automaticamente 47 scripts de varrimento de parâmetros. O tamanho global da pesquisa, por outras palavras, equivale a comprimir semanas de experiências manuais para apenas algumas horas.

Algoritmo de market making em Python com 900 linhas gerado por IA conquista o primeiro lugar no hackathon

Ao nível da estratégia, a solução final vencedora é um algoritmo de market making com cerca de 900 linhas de Python; a lógica central não provém de um único desenho, mas sim da combinação de múltiplos módulos “validados como eficazes”. Inclui evitar zonas de spread extremamente estreitas em que os arbitradores ganham de forma definitiva, estimar o preço real através da teoria da informação, ajustar dinamicamente a dimensão da cotação com base no risco de arbitragem e entrar proactivamente no mercado para conquistar zonas de maior lucro quando as ordens do livro do adversário forem “comidas” (consumidas).

A突破 mais crítica, no entanto, vem de um agente de IA que, pela primeira vez, “abandona totalmente estratégias existentes e começa do zero”. Quando a optimização estagnou em cerca de +25 edge, esse agente descobriu de forma independente um modelo de sizing com base na “probabilidade de risco de arbitragem”, elevando o desempenho da estratégia de uma só vez para +44, tornando-se o ponto de viragem de toda a competição. Este resultado também valida directamente a metodologia de Ryan: quando a pesquisa fica presa num ótimo local, reiniciar é mais eficaz do que afinar.

A vantagem absoluta da pesquisa em IA: tentativas automatizadas

Na conclusão, Ryan indica que o ponto-chave desta competição não é conceber uma “estratégia inteligente”, mas sim construir um sistema que consiga fazer uma pesquisa em grande escala, validar ideias e eliminá-las. Em vez de depender da intuição humana, deixa-se que a IA faça tentativas num enorme espaço de soluções e se aumente a eficiência através da paralelização e da automatização.

Este caso reforça ainda mais a mudança do papel da “Agentic AI” nos processos de engenharia e de investigação: a IA deixa de ser apenas uma ferramenta de apoio e pode assumir directamente a unidade principal de execução para exploração e tomada de decisão. Em alguns problemas altamente estruturados e simuláveis, os humanos podem até sair completamente do papel de “resolvedores” e, em vez disso, desenhar a própria estrutura de pesquisa e os mecanismos de avaliação.

Este artigo: a pesquisa automatizada do Claude Code vence o hackathon! Vencedor: eu literalmente não sei como é que ganhei, apareceu pela primeira vez em 鏈新聞 ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A Polymarket angaria $400M aos $15B mil milhões de avaliação com o apoio da Intercontinental Exchange

A Polymarket procura angariar $400 milhões a uma avaliação de $15 mil milhões, acrescentando a um investimento de $600 milhões da Intercontinental Exchange. Este financiamento tem como objectivo reforçar a infra-estrutura e a liquidez da sua plataforma de negociação baseada em eventos, num contexto de debates em curso sobre a sua avaliação e potencial de mercado.

GateNews1h atrás

Charles Schwab Avalia Mercados de Previsão Ligados a Eventos Financeiros num Contexto de Escrutínio Regulamentar

A Charles Schwab está a ponderar a introdução de mercados de previsão para eventos financeiros, num contexto de crescente interesse por parte de Wall Street, mantendo, ao mesmo tempo, um foco na gestão de património. O escrutínio regulamentar está a aumentar, sobretudo no que toca a apostas em desporto e entretenimento, evidenciado por legislação recente e por preocupações com transacções com informação privilegiada e manipulação do mercado.

GateNews2h atrás

Polymarket a aumentar rapidamente a sua quota de mercado, com rumores de uma ronda de financiamento para desafiar uma avaliação de 15 mil milhões de dólares

A Polymarket procura uma avaliação de 12 a 15 mil milhões de dólares, estando em conversações sobre uma ronda de financiamento inicial; se tiver sucesso, poderá crescer dez vezes num curto espaço de tempo. A concorrente Kalshi também procura uma avaliação superior a 10 mil milhões de dólares. Além disso, a Polymarket juntou-se à gigante do jogo desportivo DraftKings e lançou uma stablecoin garantida por USDC, o que demonstra uma procura forte do mercado e um modelo de negócio sólido.

ChainNewsAbmedia4h atrás

Polymarket, avaliada em 15 mil milhões de dólares, negocia uma nova ronda de financiamento de 400 milhões

De acordo com um relatório, a plataforma de mercados de previsão Polymarket está a negociar uma nova ronda de financiamento no valor de 400 milhões de dólares, com uma valorização de cerca de 15 mil milhões de dólares, estando também o seu concorrente Kalshi a fazer negociações semelhantes. O volume de transações nominais semanais da Polymarket é de 1,9 mil milhões de dólares, abrange vários eventos de mercado e disponibiliza contratos de negociação para resultados de eventos específicos, indicando a probabilidade de mercado para IPO de empresas tecnológicas como a OpenAI e a SpaceX.

MarketWhisper5h atrás

A Polymarket procura $400M milhões em financiamento a $15B mil milhões de avaliação, acrescentando ao investimento da Intercontinental Exchange

A Polymarket procura angariar $400 milhões numa avaliação de cerca de $15 mil milhões, na sequência de um investimento de $600 milhões liderado pela Intercontinental Exchange.

GateNews6h atrás

Diário do Gate (20 de abril): alerta de manipulação de altcoins despoletado pela queda acentuada da RAVE; a Charles Schwab (Schwab) considera avançar para os mercados de previsão

O Bitcoin devolveu parte do recente aumento, negociando em 74,240 dólares. O token RAVE caiu 95%, levantando alertas sobre manipulação do mercado. A Charles Schwab e a Castle Securities estão a ponderar entrar nos mercados de previsão. As bolsas dos EUA estão em alta, e os investidores estão atentos à situação no Médio Oriente e à época de resultados. A liquidez do mercado é baixa, pelo que não é preciso preocupar-se demasiado com uma correcção de curto prazo.

MarketWhisper7h atrás
Comentar
0/400
Nenhum comentário