Agile Soda ra mắt nền tảng Agentic OCR với độ chính xác phân loại tài liệu 98%

Tin nhắn từ Gate News, ngày 17 tháng 4 — Agile Soda đã giới thiệu Agentic OCR, một nền tảng tự động hóa tài liệu do AI cung cấp, không yêu cầu huấn luyện trước và có thể triển khai ngay lập tức. Nền tảng này, được xây dựng dựa trên các mô hình ngôn ngữ lớn (LLM) và các mô hình ngôn ngữ-thị giác (VLM), nhằm thay đổi thị trường OCR truyền thống bằng cách loại bỏ nhu cầu huấn luyện lại mô hình chuyên theo từng loại tài liệu.

Khác với các hệ thống OCR thông thường cần từ vài tuần đến vài tháng để huấn luyện lại cho các loại tài liệu mới, Agentic OCR cho phép người dùng xác định các trường trích xuất—chẳng hạn như họ tên, ngày ký hợp đồng và số tiền—và AI tự động nhận diện, phân loại và trích xuất thông tin. Người dùng có thể tải lên các tài liệu mẫu để tự động tạo ra các mẫu phân loại và trích xuất; việc triển khai trong cùng ngày không cần mã hoặc dữ liệu huấn luyện. Trong các bài kiểm tra xác thực trên 20 loại tài liệu, nền tảng đạt độ chính xác phân loại tài liệu 98% và độ chính xác trích xuất thông tin trên 95%.

Nền tảng tích hợp học tập chủ động, cải thiện hiệu suất khi được sử dụng. Khi người dùng chỉnh sửa các lỗi trích xuất, hệ thống sẽ tự động đưa các chỉnh sửa vào, liên tục nâng cao độ chính xác mà không cần huấn luyện thêm—mang lại cải thiện hiệu suất 5–15%. Agile Soda đã hoàn tất xác thực hiệu suất với các ngân hàng nội địa lớn, các công ty bảo hiểm và các tổ chức phát hành thẻ, đồng thời hiện đang triển khai mở rộng. Các kế hoạch trong tương lai bao gồm mở rộng sang chatbot dựa trên RAG, phân tích so sánh tài liệu và tự động hóa quy trình như một nền tảng tác nhân tài liệu toàn diện.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Perplexity 公布网页搜索代理的后训练方法;基于 Qwen3.5 的模型在准确率与成本上优于 GPT-5.4

Perplexity 使用在 Qwen3.5 模型上先进行 SFT、再进行带有 RL 的后训练,并借助多跳 QA 数据集与评分标准校验来提升搜索的准确性和效率,从而实现同级最佳的 FRAMES 表现。 摘要:Perplexity 面向网页搜索代理的后训练流程,将监督微调 (SFT) 结合在线强化学习 (RL),并通过 GRPO 算法来强制指令遵循与语言一致性。强化学习阶段使用专有的多跳可验证问答数据集以及基于评分标准的对话数据,以防止 SFT 漂移,并采用奖励门控与组内效率惩罚。评估显示,Qwen3.5-397B-SFT-RL 在 FRAMES 上达到顶级表现:单次工具调用准确率为 57.3%,四次调用为 73.9%,成本为每次查询 $0.02;在这些指标上,其表现优于 GPT-5.4 和 Claude Sonnet 4.6。定价基于 API,且不包含缓存。

GateNews9phút trước

OpenAI Codex 团队修复 OpenClaw 身份验证漏洞,显著改善智能体行为

OpenClaw 从 Pi 切换到 Codex harness,以修复静默的身份验证回退;通过两项 PR 处理桥接与回退问题;修复后,智能体从浅层心跳轮询转为完整的工作循环,从而实现进展。 摘要:OpenClaw 的 Codex harness 优化解决了一个关键的身份验证缺陷:当使用 OpenAI 模型的 Codex 时,会导致静默回退到 Pi harness。两项拉取请求修复身份验证桥接,并防止静默回退,改变了运行时适配器。因此,智能体的行为从浅层心跳轮询演进为完整的工作循环:读取上下文、分析任务、编辑代码库并验证进展,从而提升跨心跳的连续性与可见性。

GateNews1giờ trước

Mở OpenAI ChatGPT Workspace Agents: Được điều khiển bởi Codex, chia sẻ trong nhóm, tích hợp Slack

OpenAI vào ngày 22 tháng 4 đã ra mắt Workspace Agents trên ChatGPT Business/Enterprise/Edu/Teachers, được cung cấp bởi Codex, chạy dài hạn trên đám mây, được dùng chung trong nhóm và có thể thực thi ngoại tuyến. Chúng có thể chủ động phản hồi và tạo hóa đơn trên Slack, thực hiện các quy trình làm việc đa bước và hỗ trợ lập lịch. Bản nghiên cứu xem trước miễn phí đến ngày 6 tháng 5; sau đó sẽ áp dụng tính phí theo credit, giá cả sẽ được công bố sau. Cạnh tranh cùng với GoogleGeminiEnterpriseAgentPlatform và AnthropicClaudeCowork, cả ba đều tập trung vào các tác nhân cấp doanh nghiệp nhưng định vị của từng bên là khác nhau.

ChainNewsAbmedia2giờ trước

Google Cloud Next 2026: Ra mắt Nền tảng đại lý doanh nghiệp Gemini, 750 triệu USD hỗ trợ các công ty tư vấn triển khai

Google Cloud tại Cloud Next 2026 đã công bố Nền tảng tác nhân doanh nghiệp Gemini Enterprise Agent Platform, tích hợp lựa chọn mô hình, xây dựng tác nhân, DevOps, điều phối và kiểm soát an ninh cho doanh nghiệp, đồng thời ra mắt quỹ 750 triệu USD để hỗ trợ McKinsey, Accenture, Deloitte triển khai các tác nhân doanh nghiệp. Nền tảng kết hợp Ironwood TPU, A2A và MCP, xây dựng hệ sinh thái toàn ngăn của riêng mình cùng kênh dành cho tư vấn, nhằm đối đầu với OpenAI Operator và phiên bản doanh nghiệp của Anthropic Claude.

ChainNewsAbmedia2giờ trước

Google mở rộng Wiz Cloud Security trên AWS, Azure và Google Cloud

Google đã công bố các tính năng bảo mật mới và mức độ tích hợp sâu hơn của Wiz, công ty bảo mật đám mây của Israel mà họ đã mua lại với giá US$32 billion, trên Google Cloud và các nền tảng đối thủ tại sự kiện Cloud Next '26. Công ty đã giới thiệu ba tác nhân AI cho Hoạt động An ninh ở chế độ xem trước, được thiết kế cho

CryptoFrontier2giờ trước

Tác nhân Khám phá Lỗ hổng AI của 360 Tìm thấy Gần 1.000 Khai thác Zero-Day, Cạnh tranh với Mythos

360 Digital Security 的 tác nhân AI được điều khiển bởi AI tuyên bố đã phát hiện khoảng 1.000 lỗ hổng mới, bao gồm trong Office và OpenClaw; AI giờ là cốt lõi của việc phát hiện và chuẩn bị chuỗi khai thác, sánh ngang Mythos. Tóm tắt: Một báo cáo được Bloomberg trích dẫn ghi nhận rằng 360 Digital Security Group’s AI-driven Vulnerability Discovery Agent đã xác định gần 1.000 lỗ hổng phần mềm trước đây chưa được biết đến trong những tháng gần đây, bao gồm trong Microsoft Office và framework OpenClaw. Công ty cho biết AI đã trở thành động cơ cốt lõi của việc phát hiện lỗ hổng và đã công bố một công cụ AI để tăng tốc việc xây dựng chuỗi khai thác. Benincasa mô tả 360 là đối thủ cạnh tranh của Mythos của Anthropic, dựa trên phần đánh giá của Natto Thoughts về các thông báo ngôn ngữ Trung Quốc của công ty.

GateNews13giờ trước
Bình luận
0/400
Không có bình luận