Synapse Software aplica la tecnología TurboQuant para reducir los costos de procesamiento de documentos de IA

Mensaje de Gate News, 15 de abril — Synapse Software ha integrado TurboQuant, un algoritmo de cuantización vectorial desarrollado por Google Research, en su solución Synap OCR IX para mejorar las capacidades de IA documental y, al mismo tiempo, reducir los costos de adopción de IA empresarial.

TurboQuant comprime la caché KV utilizada por los modelos de lenguaje grandes (LLMs) y los modelos de lenguaje de visión (VLMs), reduciendo el consumo de memoria al procesar documentos largos. Esto permite un procesamiento de datos más rápido en la misma infraestructura de GPU. La tecnología aborda cuellos de botella de memoria que anteriormente exigían una infraestructura de GPU costosa, especialmente para manejar contextos extendidos y el procesamiento por lotes grandes sin degradación del rendimiento.

Synapse Software también admite entornos basados en CPU para empresas que no pueden desplegar infraestructura de GPU. Mediante un perfilado de precisión, la empresa logró un procesamiento de inferencia solo con CPU de aproximadamente 100 documentos por minuto, manteniendo la pérdida de calidad por debajo del 1%, reduciendo el costo total de propiedad (TCO). El enfoque de infraestructura flexible permite la adopción de IA OCR en sectores sensibles a la seguridad, como las finanzas y la administración pública, donde antes el despliegue en instalaciones propias y las limitaciones de infraestructura han dificultado la implementación de IA.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

ComfyUI recauda $30M con una valoración de $500M en una ronda liderada por Craft Ventures

Mensaje de Gate News, 25 de abril — ComfyUI, una startup de herramientas para creadores de IA, ha recaudado $30 millones con una valoración de $500 millones en una ronda de financiación liderada por Craft Ventures. Pace Capital, Chemistry y TruArrow también participaron en la inversión, tras una ronda Serie A de $19 millones a finales de 2024 respaldada por Ch

GateNews04-25 02:51

XChat se lanza en la App Store con cifrado de extremo a extremo e integración de Grok

Mensaje de Gate News, 25 de abril — XChat, la aplicación de mensajería independiente de X (exteriormente Twitter), se lanzó oficialmente en la App Store de Apple el 25 de abril. La app ya está disponible para descargar y usar en iOS, y la versión para Android llegará pronto. XChat permite a los usuarios iniciar sesión directamente con su cuenta de X,

GateNews04-25 02:00

DeepSeek V4-Flash se lanza en Ollama Cloud, servidor en EE. UU.: Claude Code, OpenClaw con un clic para conectar

Ollama Cloud ha publicado DeepSeek V4-Flash, con inferencia en servidores en Estados Unidos, y ofrece tres conjuntos de comandos de un solo clic para conectarse a Claude Code, OpenClaw y Hermes. V4-Flash/V4-Pro adoptan una arquitectura MoE, cuentan con soporte nativo de contexto 1M, y reducen costos con compresión Token-wise + atención dispersa DSA, logrando una reducción del 27% en FLOPs por token y una disminución del 10% en caché KV en escenarios de 1M. La API es compatible con OpenAI ChatCompletions y Anthropic, lo que facilita el cambio entre múltiples flujos de trabajo, y reduce el costo y el riesgo de soberanía de los datos.

ChainNewsAbmedia04-24 10:45

OristaPay lanza un sistema de pagos impulsado por IA en Telegram, habilita liquidaciones instantáneas de USDT en TON

Mensaje de Gate News, 24 de abril — OristaPay, una marca que opera bajo RD Technologies, anunció una vía de pago completa que permite a los agentes de IA ejecutar transacciones dentro del ecosistema de Telegram durante el Festival Web3 de Hong Kong. El sistema permite a los usuarios activar transacciones de activos digitales mediante interacciones de lenguaje natural sin salir de la interfaz de chat. Durante una demostración en vivo, un agente de IA impulsado por BytePlus procesó una solicitud de servicio, interpretó la intención del usuario e inició el pago a través del canal de OristaPay. La transacción se completó al instante usando USDT en la red de blockchain TON. La infraestructura de la plataforma se construye sobre cinco capacidades financieras fundamentales: cuentas por cobrar, cuentas por pagar, depósitos, remesas y gestión patrimonial, creando un ecosistema unificado que conecta activos de blockchain con casos de uso comerciales. OristaPay proporciona a los desarrolladores interfaces estandarizadas para integrar funcionalidades de pago en aplicaciones de IA con una complejidad mínima. La plataforma opera bajo el marco regulatorio de Hong Kong, posicionándola como una solución segura para empresas que hacen la transición hacia el comercio basado en Web3. La iniciativa busca abordar las limitaciones de las pasarelas de pago tradicionales combinando modelos de lenguaje a gran escala, infraestructura blockchain y plataformas sociales en un único ecosistema financiero.

GateNews04-24 07:01

DBS amplía el programa de GenAI de Spark para las PYMES de Singapur

DBS anunció el 24 de abril la expansión de su programa Spark GenAI, desarrollado en asociación con Enterprise Singapore y la Autoridad de Desarrollo de Infocomm Media (IMDA), para apoyar a las pequeñas y medianas empresas locales (SMEs) en la adopción de inteligencia artificial. El programa utiliza una estructura de tres niveles

CryptoFrontier04-24 06:41
Comentar
0/400
Sin comentarios