Mensagem do Gate News, 24 de abril — DeepSeek V4-Pro e DeepSeek V4-Flash foram oficialmente lançados e tiveram seu código aberto em 24 de abril, com o comprimento de processamento de contexto sendo expandido significativamente de 128K para 1M, representando um aumento de capacidade de quase 10 vezes. A Huawei Computing anunciou que seus produtos de supernó Ascend suportam totalmente os modelos da série DeepSeek V4 por meio de estreita colaboração entre tecnologias de chip e de modelo.

O Ascend 950 da Huawei atinge implantação de inferência do modelo DeepSeek V4 com alta taxa de transferência e baixa latência por meio de técnicas de kernel fundido e paralelismo de múltiplos streams para reduzir a sobrecarga de computação de Attention e de acesso à memória. Para o DeepSeek V4-Pro com entrada de 8K, o Ascend 950 atinge aproximadamente 20ms de TPOT com 4.700 TPS de throughput de Decode de cartão único; para o DeepSeek V4-Flash com entrada abaixo de 8K, ele alcança aproximadamente 10ms de TPOT com throughput de 1.600 TPS. A série de supernós Ascend A3 também alcança compatibilidade total, com implementações de referência de treinamento fornecidas para ajuste fino rápido. Com base no supernó Ascend A3 de 64 cartões com modo EP grande, o DeepSeek V4-Flash atinge mais de 2.000 TPS de throughput de Decode de cartão único em cenários de entrada/saída de 8K/1K usando o mecanismo de inferência vLLM. As linhas completas de produtos Ascend A2, A3 e 950 da Huawei suportam tanto o DeepSeek V4-Flash quanto o V4-Pro.

A Huawei Cloud anunciou compatibilidade de primeira-mover com o DeepSeek V4, fornecendo aos desenvolvedores serviços de token de API com um clique por meio de sua plataforma MaaS. A Huawei Cloud otimizou as capacidades de camada do sistema, camada de operadores e camada de cluster para garantir adaptação rápida do modelo e implantação com alto desempenho. Empresas incluindo Kingsoft WPS e 360 já integraram o novo modelo da DeepSeek via a Huawei Cloud.

A Cambricon também anunciou compatibilidade Day 0 com o DeepSeek V4-Flash e V4-Pro com base na estrutura de inferência vLLM, com código de adaptação em código aberto para a comunidade do GitHub. A Cambricon anteriormente alcançou adaptação de primeira-mover quando o DeepSeek V3.2 foi lançado no ano passado, tendo realizado profunda otimização de desempenho colaborativa software-hardware nos modelos da série DeepSeek.

Ver fonte

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Google Planeja Investir Até $40 Bilhões na Anthropic, Promete 5+ Gigawatts de Poder de Computação

Notícias do setor de IA

Mensagem do Gate News, 24 de abril — De acordo com fontes do mercado, o Google planeja investir até $40 bilhões na Anthropic. O investimento começará com um investimento inicial de $10 bilhões em dinheiro, seguido por até mais $30 bilhões condicionados à realização de marcos especificados. O Google também fornecerá à Anthropic, no âmbito da parceria, pelo menos 5 gigawatts de poder de computação.

GateNews16m atrás

Regulador suíço FINMA alerta que a ferramenta de IA Mythos, da Anthropic, representa risco financeiro

Notícias do setor de IA

Mensagem do Gate News, 24 de abril — a Autoridade de Supervisão do Mercado Financeiro da Suíça (FINMA) afirmou que permitir que bancos adotem rápida e convenientemente a ferramenta de inteligência artificial Mythos, da Anthropic, representaria riscos graves para o

GateNews39m atrás

Fere AI Conclui Rodada de Financiamento de US$ 1,3 Milhão Liderada pela Ethereal Ventures

Agente de IA Notícias do setor de IA

Mensagem do Gate News, 24 de abril — A Fere AI, uma plataforma de agente de negociação de ativos digitais alimentada por IA, anunciou a conclusão de uma rodada de financiamento de US$ 1,3 milhão liderada pela Ethereal Ventures, com a participação da Galaxy Vision Hill e da Kosmos Ventures. A plataforma oferece suporte a redes cross-chain, incluindo Ethereum,

GateNews1h atrás

Anthropic reverte mudanças no Claude Code após queda de qualidade; todas as correções concluídas

Notícias do setor de IA

Mensagem do Gate News, 24 de abril — A Anthropic reconheceu uma recente queda na qualidade do Claude Code e confirmou que todos os problemas relacionados foram resolvidos por meio de rollbacks e correções. Os problemas decorreram de três ajustes de produto e prompt feitos entre o início e meados de abril. Em 4 de março, o

GateNews3h atrás

Cofundador da NeoSoul Kaelan: a Indústria de IA deve permitir que brinquedos existam; a inovação muitas vezes começa como produtos experimentais

Notícias do setor de IA

Mensagem do Gate News, 24 de abril — Em um fórum recente em Hong Kong sobre finanças inteligentes e criptografadas, o cofundador da NeoSoul, Kaelan, compartilhou percepções sobre como avaliar projetos de IA no estágio inicial, em uma indústria de IA que evolui rapidamente. Além de avaliar produtos atuais, as equipes devem demonstrar a capacidade de acompanhar as capacidades dos modelos subjacentes, afirmou ele.

GateNews3h atrás

Meta vai implantar dezenas de milhões de chips AWS Graviton5 em acordo multianual de bilhões de dólares

Ações Notícias do setor de IA

Mensagem do Gate News, 24 de abril — A Meta assinou um acordo multianual com a Amazon Web Services para implantar dezenas de milhões de processadores Graviton5 para sua infraestrutura de IA, tornando a Meta um dos maiores clientes globais de Graviton da AWS. O acordo, com duração de três a cinco anos, é avaliado em bilhões de d

GateNews4h atrás

Comentário

0/400

Sem comentários