Gate News 消息，4 月 24 日 — V4 已公開披露其 V4-Pro 模型的內部自我測試（dogfooding）數據。該公司從超過 50 位工程師收集了約 200 項真實世界的工程任務，涵蓋功能開發、錯誤修復、重構以及跨技術棧的診斷，包括 PyTorch、CUDA、Rust 和 C++。經過嚴格篩選後，保留了 30 項任務用於基準評估。

V4-Pro-Max 的程式通過率達到 67%，顯著超越 Sonnet 4.5 的 47%，並接近 Opus 4.5 的 70%。不過，它仍落後於 Opus 4.5 Thinking (73%) 與 Opus 4.6 Thinking (80%)，同時遠高於 Haiku 4.5 的 13%。

在一項包含 85 位受訪者的內部調查中，所有參與者都表示在日常工作流程中使用 V4-Pro 進行具代理（agentic）的程式編寫。52% 將 V4-Pro 作為其預設的主要程式模型，39% 傾向於表示批准，而不到 9% 表達不認同。回報的問題包括底層錯誤、對含糊指令的誤解，以及偶爾出現過度思考的行為。

View Source

免責聲明：本頁面資訊可能來自第三方，不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考，不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證，對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為，價格波動劇烈，您可能損失全部投資本金。請充分了解相關風險，並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明。

川普政府公布打擊 AI 提煉計劃，控中企系統性竊取模型能力

AI 行業動態

白宮科技政策辦公室（OSTP）總統助理邁克爾·J·克拉齊奧斯（Michael J. Kratsios）於 4 月 23 日發表官方聲明，表示川普政府掌握信息，顯示外國實體（主要位於中國）正在蓄意針對美國大型人工智慧公司，透過「數萬個代理帳戶」及越獄技術系統性提取美國 AI 模型能力，並同步公布四項應對措施。

Market Whisper11分鐘前

DeepSeek 推出 V4 開源預覽版，技術評分 3206 超越 GPT-5.4

AI 行業動態

DeepSeek 於 4 月 24 日正式推出 V4 預覽版系列，以 MIT 許可協議開源，模型權重已同步上線 Hugging Face 及 ModelScope。根據 DeepSeek V4 技術報告，V4-Pro-Max（最高推理力度模式）在 Codeforces 基準取得 3206 分，超越 GPT-5.4。

Market Whisper27分鐘前

寒武紀完成 DeepSeek-V4 的第 0 天適配，為中國 AI 晶片生態系樹立里程碑

AI 行業動態

Gate News 訊息，4 月 24 日——寒武紀（Cambricon）今天宣布，已使用其專有 NeuWare 軟體生態系與 vLLM 框架完成 DeepSeek-V4 的第 0 天（Day 0）適配。DeepSeek-V4 是 DeepSeek 最新的大型語言模型。適配程式碼同時開源，標誌著

GateNews43分鐘前

騰訊開源 Hy3 預覽版，程式碼基準測試較前代提升 40%

AI 行業動態

騰訊於 4 月 23 日在 GitHub、Hugging Face 及 ModelScope 平台正式開源 Hy3 預覽版大型語言模型，並同步於騰訊雲端（Tencent Cloud）提供付費 API 服務。據 Decrypt 於 4 月 24 日報導，Hy3 預覽版自 1 月下旬啟動訓練，至發布日歷時不足三個月。

Market Whisper51分鐘前

如果未破產，FTX 投資組合價值 158 兆韓元

股票 AI 行業動態

FTX 這家集中式加密貨幣交易所因流動性短缺與資金外流，於 2022 年 11 月申請第 11 章破產保護；根據 Park 引用的分析，如果它沒有倒閉，本應持有約 158.796 兆韓元的投資價值。

Crypto Frontier53分鐘前

小米揭露 MiMo-V2-Pro 訓練細節：1T 模型參數，部署數千台 GPU

AI 行業動態

Gate 新聞訊息，4 月 24 日——小米大型語言模型團隊負責人羅福立在一場深入採訪中披露，MiMo-V2-Pro 模型總計擁有 1 兆（trillion）參數，訓練過程需要數千台 GPU。她指出，1T 規模代表達成性能接近 Claude Opus 4.6 等級所需的最低門檻，並取得下一階段 AI 代理的競爭性入場票。

GateNews1小時前

留言

0/400

暫無留言