A Synapse Software aplica a tecnologia TurboQuant para reduzir os custos de processamento de documentos de IA

Mensagem de Gate News, 15 de Abril — A Synapse Software integrou o TurboQuant, um algoritmo de quantização vetorial desenvolvido pela Google Research, na sua solução Synap OCR IX para melhorar as capacidades de IA para documentos, ao mesmo tempo que reduz os custos de adoção de IA pelas empresas.

O TurboQuant comprime a cache KV utilizada por (LLMs) e por (VLMs), modelos de linguagem de visão, reduzindo o consumo de memória ao processar documentos longos. Isto permite um processamento de dados mais rápido na mesma infraestrutura de GPU. A tecnologia aborda estrangulamentos de memória que anteriormente exigiam uma infraestrutura de GPU dispendiosa, especialmente no tratamento de contextos alargados e de processamento em grandes lotes sem degradação de desempenho.

A Synapse Software também suporta ambientes baseados em CPU para empresas que não conseguem implementar uma infraestrutura de GPU. Através de uma monitorização de precisão, a empresa obteve um processamento de inferência apenas com CPU de cerca de 100 documentos por minuto, mantendo a perda de qualidade abaixo de 1%, reduzindo o custo total de propriedade (TCO). A abordagem flexível de infraestrutura permite a adoção de IA para OCR em setores sensíveis à segurança, como finanças e administração pública, onde anteriormente a implementação no local e as limitações de infraestrutura dificultavam a aplicação de IA.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

ComfyUI Angaria $30M a $500M de Avaliação numa Ronda Liderada pela Craft Ventures

Mensagem de notícias da Gate, 25 de abril — A ComfyUI, uma startup de ferramentas para criadores de IA, angariou $30 milhões a uma avaliação de $500 milhões numa ronda de financiamento liderada pela Craft Ventures. A Pace Capital, a Chemistry e a TruArrow também participaram no investimento, na sequência de uma ronda Série A de $19 milhões no final de 2024 apoiada pela Chemistry Ventures, Cursor Capital e pelo fundador da Vercel, Guillermo Rauch.

GateNews04-25 02:51

XChat é Lançado na App Store com Encriptação de Ponta a Ponta e Integração com Grok

Mensagem de Gate News, 25 de Abril — XChat, a aplicação de mensagens independente da X (anteriormente Twitter), foi oficialmente lançada na App Store da Apple a 25 de Abril. A app já está disponível para descarregar e utilizar no iOS, com a versão para Android a chegar em breve. O XChat permite que os utilizadores iniciem sessão diretamente com a sua conta X,

GateNews04-25 02:00

DeepSeek V4-Flash chega ao Ollama Cloud, servidor nos EUA: Claude Code, OpenClaw ligação automática com um clique

Ollama Cloud colocou DeepSeek V4-Flash à venda, com inferência em servidores nos EUA, disponibilizando três conjuntos de comandos de acesso rápido para ligar ao Claude Code, OpenClaw e Hermes. V4-Flash/V4-Pro adoptam uma arquitectura MoE, com suporte nativo para contexto de 1M, e reduzem custos com compressão Token-wise + atenção esparsa DSA; em cenários de 1M, os FLOPs por token caem 27% e a cache KV reduz 10%. A API é compatível com OpenAI ChatCompletions e Anthropic, facilitando a alternância entre vários fluxos de trabalho, reduzindo custos e riscos de soberania dos dados.

ChainNewsAbmedia04-24 10:45

OristaPay Lança Sistema de Pagamentos Impulsionado por IA no Telegram, Permite Liquidações Instantâneas de USDT na TON

Mensagem de Gate News, 24 de abril — A OristaPay, uma marca que opera sob a RD Technologies, anunciou uma via de pagamento completa que permite a agentes de IA executar transações no ecossistema do Telegram durante o Hong Kong Web3 Festival. O sistema permite que os utilizadores iniciem transações de ativos digitais através de interações em linguagem natural sem sair da interface de chat.

GateNews04-24 07:01

A DBS alarga o programa de GenAI da Spark para as PME de Singapura

A DBS anunciou a 24 de abril a expansão do seu programa Spark GenAI, desenvolvido em parceria com a Enterprise Singapore e a Infocomm Media Development Authority (IMDA), para apoiar as pequenas e médias empresas locais (SMEs) na adoção de inteligência artificial. O programa utiliza uma estrutura em três níveis

CryptoFrontier04-24 06:41
Comentar
0/400
Nenhum comentário