Gate News 訊息,4 月 23 日——Google 研究人員(包含 He Kaiming 和 Xie Saining)發表了一篇論文,介紹 Vision Banana:一款通用型視覺理解模型。該模型是透過對該公司的 Nano Banana Pro (Gemini 3 Pro Image) 影像生成模型進行輕量指令微調所打造。這項關鍵創新將所有視覺任務的輸出統一為 RGB 影像,使得能夠在不使用任務特定架構或損失函數的情況下,透過影像生成來完成分割、深度估計與表面法向預測。
在語意分割方面,Vision Banana 在 Cityscapes 上相較專用模型 SAM 3 領先 4.7 個百分點;在指代表達式分割(referring expression segmentation)方面,它超越了 SAM 3 Agent。不過在實例分割(instance segmentation)上,它落後於 SAM 3。對於 3D 任務,度量深度估計在四個標準資料集上達到 0.929 的平均準確率,超過 Depth Anything V3 的 0.918。推論時僅使用合成資料,沒有任何真實深度資訊或相機參數。表面法向估計在三個室內基準測試中取得了最先進的結果。
微調涉及將極少量的視覺任務資料混入原始影像生成訓練,同時保留模型的生成能力——在生成品質測試中的表現與原始 Nano Banana Pro 相同。論文提出:視覺中的影像生成預訓練與語言中的文字生成預訓練相類似;模型在生成過程中學習用於影像理解的內部表徵,而指令微調只是釋放這種能力。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
Samsung SDS擴大Google Cloud合作夥伴關係,以AI與安全服務服務受監管領域
門戶新聞訊息,4月23日——Samsung SDS擴大了與Google Cloud的合作,提供AI、雲端運算和安全服務,面向受監管產業,包括政府與金融服務。
該公司將為需要數據本地化、低延遲和具韌性的基礎設施的客戶部署Google Distributed Cloud
GateNews3分鐘前
Sullivan & Cromwell 因法庭文件中的 AI 幻覺而致歉:含 40 則錯誤引文
Gate News 訊息,4月23日——Sullivan & Cromwell 是一家大型華爾街律師事務所,在提交了一份包含約 40 則錯誤引文及其他因 AI 幻覺(hallucinations)造成的錯誤之後,向一名聯邦法官道歉。該事務所全球重整團隊的共同負責人 Andrew Dietderich &
GateNews19分鐘前
騰訊發布並開源鴻蒙 Hy3 預覽版,擁有 295B 參數
Gate News 消息,4 月 23 日——騰訊發布並開源了鴻蒙 Hy3 預覽版,這是一種混合式「專家混合(Mixture-of-Experts)」語言模型,融合了快速與慢速思考。該模型總參數量為 2950 億,啟用參數為 210 億,支援最高上下文長度 256K
GateNews33分鐘前
南韓、越南簽署70+份人工智慧、能源與數據基礎設施諒解備忘錄
Gate 新聞訊息,4月23日——南韓與越南在李在明總統於4月23日進行對河內的國是訪問期間,簽署了超過70份諒解備忘錄 (MOUs),涵蓋人工智慧、能源、基礎設施與電信等領域。由超過500名高管參與的商務論壇討論了人工智慧與電力產業生態系統,其中包括三星、SK、LG與現代在內的主要韓國大型企業均有代表。
GateNews33分鐘前
AI 答題引擎集體污染:Gemini 3 正確答案中 56% 無來源支持
本文指出 AI 答題引擎查詢時即時引用網頁,若來源為 AI 生成或缺乏證據,便污染結果,無需再訓練即可生效,稱為檢索污染(retrieval contamination)。Gemini3 雖正確率高,但 56% 的答案缺乏可驗證來源;Lily Ray、Grokipedia 等案例顯示 AI 容易被自創內容欺騙。結論是引用層與可靠作者脫鉤,形成自我強化的污染循環,使用者仍須回溯原始來源,勿把回答當成事實查核終點。
鏈新聞abmedia41分鐘前
Anthropic 向法院表示:部署在五角大廈的 AI 模型沒有「Kill Switch」
Gate News 消息,4月23日——Anthropic 向美國哥倫比亞特區巡迴上訴法院提交了一份文件,表示一旦其 AI 模型部署在五角大廈環境中,公司既沒有可見性也沒有技術手段來控制或關閉這些模型,且不存在所謂的「kill switch」
GateNews43分鐘前