Mensagem do Gate News, 24 de Abril — O engenheiro da OpenAI Clive Chan apresentou objecções detalhadas ao capítulo de recomendações de hardware no relatório técnico V4, chamando-lhe “surpreendentemente medíocre e propenso a erros” em comparação com a aclamada versão V3. A orientação de hardware da V3, que incluía sessões de Q&A que se tornaram no tema de discussão mais popular na conferência académica ISCA, ofereceu recomendações específicas alinhadas com normas de interconexão da indústria. Já a V4, em contraste, é muito mais vaga.
Chan contestou sistematicamente três recomendações-chave. No consumo de energia, o relatório sugere que a optimização de software permite que os chips executem simultaneamente em capacidade total computação, armazenamento e comunicação, e recomenda que os fabricantes de chips reservem folga adicional de energia. Chan argumenta que isso é contraproducente: o poder total do chip é limitado por restrições das limitações físicas do processo, pelo que reservar mais margem de energia apenas reduz a frequência de funcionamento, acabando por diminuir o desempenho computacional. No que respeita à transferência de dados de GPU para GPU, o relatório defende um modelo pull—em que as GPUs buscam activamente dados—em vez de um modelo push, citando a elevada sobrecarga de notificações em operações push. Chan contesta isso, sustentando que o pull é na verdade mais lento e que capacidades melhoradas dos adaptadores de rede seriam preferíveis. No entanto, os dois podem estar a discutir camadas diferentes do problema: o relatório trata a sobrecarga do mecanismo de notificação, enquanto Chan se refere à própria latência de transmissão.
Quanto às funções de activação, o relatório recomenda substituir SwiGLU por funções mais simples para reduzir a carga computacional. Chan não vê mérito nisso, observando que o Sonic MoE já demonstrou desempenho óptimo usando SwiGLU. Chan suspeita que o DeepSeek pode ter “enfraquecido deliberadamente esta secção.”
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
Xpeng e Xiaomi lideram avanço de IA no automóvel no Beijing Auto Show
Notícia do Gate, 24 de Abril — Os fabricantes automóveis chineses mostraram sistemas avançados de IA para automóveis no Beijing Auto Show a 24 de Abril, enquanto o país acelera a sua estratégia AI Plus e procura uma maior independência de semicondutores estrangeiros.
A Xpeng demonstrou um estacionamento controlado por voz que permite aos condutores de emitir comandos falados em vez de selecionar manualmente localizações.
GateNews34m atrás
Antigo Engenheiro da ByteDance Seed: A iteração de IA da ByteDance demora seis meses, em comparação com os três meses do Google
Mensagem de Gate News, 24 de abril — Zhang Chi, um antigo engenheiro da equipa Seed da ByteDance e atualmente professor assistente na Universidade de Pequim, revelou no podcast "Into Asia" que a ByteDance necessita de aproximadamente seis meses para concluir um ciclo completo de treino de pré-formação de modelos de linguagem de grande dimensão (pretraining
GateNews50m atrás
Naver Launches AI Tab Beta as Google Gemini Enters South Korea Search Market
Gate News message, April 24 — Naver announced the start of a closed beta for AI Tab, its new conversational search feature, following Google's launch of Gemini in Chrome in South Korea.
AI Tab will appear alongside Naver's existing search tabs, offering users a dedicated space for conversational
GateNews1h atrás
As Contratações de Engenharia em IA na Índia Disparam 59,5%, Expandem Além dos Centros Tecnológicos
O Relatório do Mercado de Trabalho de IA 2026 da LinkedIn, publicado a 24 de abril, revelou que a contratação de engenharia de IA na Índia aumentou 59,5% em termos anuais, assinalando o ritmo mais acelerado entre os mercados estudados pela plataforma.
O crescimento foi impulsionado pela procura a alastrar para além dos centros tecnológicos estabelecidos. Cidades incluindo
CryptoFrontier1h atrás
Banco da Commonwealth reduz 120 empregos no meio da expansão da IA
O Commonwealth Bank of Australia anunciou que vai cortar aproximadamente 120 postos de trabalho à medida que o maior banco do país revê funções e aumenta a sua utilização de inteligência artificial, de acordo com a Bloomberg. Os cortes incluem 43 funções na Bankwest, no oeste da Austrália, com seis cargos afetados pela automação. Isto é
CryptoFrontier2h atrás
Razões para a seleção do treino XAI pela Cursor: o poder de computação ficou bloqueado, a SpaceX detém mais 60 mil milhões de dólares em opções de compra
O anúncio da Anysphere afirma que a Cursor irá, em conjunto com a xAI, treinar novos modelos com a infraestrutura Colossus para ultrapassar o estrangulamento de capacidade computacional; a SpaceX apresentou uma opção de compra de 60 mil milhões de dólares (aquisição total até 2026), caso não seja possível, pagará cerca de 10 mil milhões de dólares como compensação de colaboração. Estas duas transacções decorrem em simultâneo, reconfigurando quem consegue treinar a Cursor e quem consegue comprar a Cursor; a Cursor continua a permitir vários backends de modelos, mas a orientação a longo prazo depende de saber se a SpaceX exercerá o direito de compra.
ChainNewsAbmedia2h atrás