Google 推出第八代 TPU 芯片:价格-性能提升更好,并将训练与推理分离

Gate News 消息,4 月 22 日——Google Cloud 宣布于 4 月 22 日发布其第八代自研定制 TPU (Tensor Processing Unit) 芯片。新产品阵容包括 TPU 8t,专为 AI 训练任务而设计;以及 TPU 8i,为 AI 推理工作负载进行了优化。两款芯片都将在今年晚些时候开始供货。谷歌还发布了用于构建 AI 代理的新工具,并宣布一项 $750 百万基金以推动企业采用 AI。

TPU 8t 在相同价格水平下,其性能比谷歌上一代 Ironwood TPU 提升 2.8 倍。TPU 8i 相较其前代产品性能提升 80%,并采用静态随机存取存储器 (SRAM) 架构,实现“具有成本效益的大规模吞吐和低延迟,使数百万个代理能够同时运行”,据首席执行官 Sundar Pichai 表示。与 Ironwood 相比,TPU 8t 和 TPU 8i 的每瓦效率均实现了超过两倍的提升,其中 TPU 8t 提升 124%,TPU 8i 提升 117%。谷歌在整个技术栈中优化了能效,并集成动态功耗管理系统,根据实时需求调整能耗。

谷歌自研模型现在通过直接客户 API 调用,每分钟处理超过 1600 亿个 token,高于上个季度的 1000 亿。如今,AI 在谷歌产生了 75% 的所有新增代码,而去年秋季为 50%。谷歌的企业产品 Gemini Enterprise,其付费月活用户环比增长 40%。该公司预计到 2026 年,将其机器学习计算预算中略多于一半投入云服务,以更好地服务云端客户及合作伙伴。谷歌也在扩大与博通(Broadcom)的合作,以开发并供给未来世代的定制 TPU 芯片,因为大型科技公司正寻求对英伟达(NVIDIA)和 AMD 价格昂贵且供给受限的 GPU 的替代方案。

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Modelos de ciberseguridad de nivel armamentístico de Anthropic Mythos accedidos sin autorización: ¿cómo lo lograron?

Bloomberg informó que, mediante una autorización legal de un tercer contratista de Anthropic, un grupo privado de foro obtuvo acceso no autorizado a Mythos. Mythos es una IA defensiva para empresas, que solo se ofrece a grandes organizaciones con un riguroso proceso de revisión. El grupo utilizó el control que tenía sobre la URL del modelo para inferir la ubicación del sistema y acceder, y proporcionó capturas de pantalla como demostración, afirmando que todavía estaba en uso pero que no había malas intenciones. Anthropic está investigando y, de forma preliminar, considera que se trata de un abuso de permisos en lugar de una intrusión externa. Este caso pone de manifiesto el riesgo de confiar modelos de alta sensibilidad a la gestión de terceros, y se requiere mejorar la resiliencia de la gobernanza y los mecanismos de confianza.

ChainNewsAbmediaHace9m

Moomoo? CISO? Alerta: ShinyHunters afirma haber comprometido los sistemas internos de Anthropic

Según una alerta publicada en la plataforma X el 23 de abril por el CISO de SlowMist, 23pds, el grupo de hackers ShinyHunters afirma haber comprometido sistemas internos relacionados con el modelo Anthropic Mythos y ha compartido públicamente capturas de evidencia, como el panel de gestión de usuarios, el panel de experimentos de IA y análisis del rendimiento del modelo y sus costos; sin embargo, Anthropic aún no ha emitido un comunicado oficial.

MarketWhisperHace12m

Chrome se vuelve “colega de IA”: tareas de automatización web Auto Browse, suscripción mensual para empresas de 6 dólares

Chrome Enterprise lanza Auto Browse y Chrome Skills impulsados por Gemini, para que el navegador ejecute tareas de varios pasos de forma automática, pero requiere que el usuario haga clic para confirmar; se pueden guardar/compartir flujos de trabajo de IA y se integra con Gmail, calendario y Drive, con control DLP incluido; cuesta 6 USD al mes y se posiciona como convertir el navegador en un compañero de IA.

ChainNewsAbmediaHace45m

OpenAI anuncia los ChatGPT Workspace Agents: impulsados por Codex, compartidos por el equipo, integración con Slack

OpenAI lanzó Workspace Agents en ChatGPT Business/Enterprise/Edu/Teachers el 22 de abril, impulsados por Codex, con ejecución en la nube de larga duración, compartidos por equipos y con capacidad de funcionar sin conexión; pueden responder proactivamente en Slack y emitir tickets, ejecutar flujos de trabajo de múltiples pasos y también admitir la programación. La vista previa de investigación es gratuita hasta el 6 de mayo; después, se cobrará mediante una tarifa basada en créditos, y los precios se darán a conocer. Compiten en el mismo escenario que el GoogleGeminiEnterpriseAgentPlatform y AnthropicClaudeCowork; las tres se centran en agentes a nivel empresarial, pero su posicionamiento es distinto.

ChainNewsAbmediaHace48m

Google Cloud Next 2026: lanza la plataforma de agentes empresariales Gemini, 750 millones de dólares para ayudar a los consultores a implementarlo

Google Cloud anunció en Cloud Next 2026 la plataforma Gemini Enterprise Agent Platform, que integra selección de modelos, construcción de agentes, DevOps, orquestación y controles de seguridad para empresas, y lanzó un fondo de 750 millones de dólares para ayudar a McKinsey, Accenture y Deloitte a implementar agentes empresariales. La plataforma, junto con Ironwood TPU, A2A y MCP, construye su propio stack completo y una vía de acceso para consultores, para hacer frente a OpenAI Operator y a la versión empresarial de Anthropic Claude.

ChainNewsAbmediaHace49m

Google amplía la seguridad en la nube Wiz en AWS, Azure y Google Cloud

Google anunció nuevas funciones de seguridad e integración más profunda de Wiz, la empresa israelí de ciberseguridad que adquirió por US$32 billion, en Google Cloud y plataformas rivales en su evento Cloud Next '26. La compañía presentó tres agentes de IA para las Operaciones de Seguridad en modo de vista previa, diseñados para

CryptoFrontierHace58m
Comentar
0/400
Sin comentarios