在 Paradigm 主辦的 Autoresearch Hackathon 中,一名幾乎「沒有親自設計策略」的參賽者,卻最終拿下冠軍。冠軍得主 Ryan Li 同時也是 SurfAI 執行長表示,整個解題過程幾乎完全交由 AI 完成,自己甚至「不知道怎麼贏的」,最終仍在 Prediction Market Challenge 中奪下第一名。
這場競賽要求參賽者在模擬的二元預測市場中設計做市策略,透過限價單在訂單簿中提供流動性,並在「套利者」與「散戶流量」之間取得利潤平衡。最終排名依據策略在 200 次隨機模擬中的平均 edge(利潤優勢)計算。Ryan 的最終成績為 42.32 美元 mean edge(以三組隨機種子中位數計算),在重新評分後登上榜首。
Claude Code + Codex 自動研究,產出 1039 個策略
不同於傳統量化交易或市場做市策略依賴人類專家調參與建模,Ryan 採取的是近年由 Rich Sutton 提出的「Bitter Lesson」思路,讓計算力與搜尋規模擊敗人類經驗。他將整個問題轉化為「自動化研究」(autoresearch)流程,透過多個 AI agent 平行探索解法空間,而非手動優化。
整個過程中,他動用了 8 至 20 個並行運行的 AI agent(主要基於 Claude Code,並輔以 Codex),每個 agent 各自負責不同假設與參數空間,持續生成策略、執行模擬、回報結果。最終累積產出 1,039 個策略變體,進行超過 2,000 次評估,並自動生成 47 個參數掃描腳本。整體搜尋規模,相當於將數週人工實驗壓縮至數小時完成。
AI 產出的 900 行 Python 做市演算法拿下黑客松冠軍
在策略層面,最終勝出方案是一套約 900 行 Python 的做市演算法,核心邏輯並非來自單一設計,而是多個「被驗證有效」的模組疊加。包括避開套利者必勝的極窄價差區間、透過資訊理論估計真實價格、依據套利風險動態調整報價規模,以及在對手訂單簿被吃空時主動進場搶佔高利潤區間等。
其中最關鍵的突破,來自一次「完全拋棄既有策略、從零開始」的 AI agent。當整體優化停滯在約 +25 edge 時,該 agent 獨立發現一套以「套利風險機率」為核心的 sizing 模型,將策略表現一舉推升至 +44,成為整場比賽的轉折點。這一結果也直接印證 Ryan 的方法論:當搜尋陷入局部最優時,重啟比微調更有效。
AI 研究的絕對優勢:自動化試錯
Ryan 在總結中指出,這場比賽的關鍵不在於設計一個「聰明的策略」,而是建立一個可以大規模搜尋、驗證並淘汰想法的系統。與其依賴人類直覺,不如讓 AI 在龐大的解空間中試錯,並透過並行化與自動化放大效率。
這一案例也進一步強化了「Agentic AI」在工程與研究流程中的角色轉變,AI 不再只是輔助工具,而是可以直接承擔探索與決策的核心執行單位。在某些高度結構化、可模擬的問題中,人類甚至可以完全退出「解題者」的位置,轉而設計搜尋框架與評估機制本身。
這篇文章 Claude Code 自動化研究拿下黑客松冠軍!得主:我根本不知的怎麼贏的 最早出現於 鏈新聞 ABMedia。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
首檔預測市場 ETF 下週上市,公開下注美國國會大選結果
根據市場消息,首檔預測市場ETF預計5月5日生效,Roundhill 已提交申請,主打民主黨/共和黨在美國總統、參議院、眾議院選舉的對決。ETF價格反映事件發生機率,隨民調與新聞波動。專家認為可提升市場流動性,但仍須面臨CFTC與州府就監管的爭議,及體育賽事等範圍的法律挑戰。
鏈新聞abmedia35分鐘前
預測市場交易員押注:在《英雄聯盟》冠軍賽中賭 $43K T1 戰勝 Nongshim
Gate News 訊息,4 月 29 日——根據 Odaily Seer 的監測,一名勝率 53% 的交易員在 Polymarket 上購買了價值 $43,000 的預測合約,押注 T1 將在一場即將到來的《英雄聯盟》比賽中戰勝 Nongshim Red Force (NS)。該倉位以每份合約 75 美分開立
GateNews49分鐘前
CFTC 對威斯康辛州州長提起訴訟,因其對預測市場監管事項的預測
美國商品期貨交易委員會於週二向威斯康辛州民主黨州長托尼·埃弗斯(Tony Evers)、總檢察長喬許·考爾(Joshua Kaul),以及約翰·迪萊特(John Dillett,威斯康辛州行政部轄下博彩事務部門的管理人)提起訴訟,地點在美國東部地區聯邦地方法院(U.S. District Court for the Eastern District of)
Crypto Frontier50分鐘前
美國聯邦法院首起 Polymarket 內幕交易開審,美軍士兵拒不認罪
據 Decrypt 報道,美國陸軍一級軍士長加農·肯·範·戴克(Gannon Ken Van Dyke)於 4 月 29 日在紐約聯邦法院就利用機密情報在預測市場 Polymarket 獲利的指控拒不認罪,以 25 萬美元保釋金獲釋,並被勒令上繳護照及限制出行;檢察官稱,這是聯邦政府首次就預測市場活動相關案件提起訴訟。
Market Whisper1小時前
Polymarket 預測:Powell 在 4 月記者會上說「Good Afternoon」的機率達 98.3%
Gate News 訊息,4 月 29 日 — 在 Polymarket 上,有一項針對美聯儲主席 Jerome Powell 將在 4 月記者會上說些什麼的預測市場事件顯示,「Good Afternoon」選項已達到 98.3% 的機率;此事件的交易量合計為 $57,749,且在結算價格接近 98.3 美分時。
GateNews1小時前
Polymarket 否認 30 萬筆記錄外洩指控,稱 API 數據為公開可審計
根據 Polymarket 於 4 月 29 日在 X 貼文,網路安全帳號 Dark Web Informer 指控去中心化預測市場平台 Polymarket 遭到入侵,超過 30 萬筆記錄及一個漏洞利用工具包被洩露至網路犯罪論壇;Polymarket 隨即在 X 聲明否認,表示所有鏈上數據公開可審計。
Market Whisper1小時前