กระดาษวิจัยใหม่ของ DeepSeek เสนอระบบการวิเคราะห์ DualPath ซึ่งทำให้ปริมาณงานของเอไอแทบจะเพิ่มขึ้นเป็นสองเท่า

GateNews
source.from

PANews รายงานเมื่อวันที่ 27 กุมภาพันธ์ว่าด้วยความกระตือรือร้นของอุตสาหกรรมสําหรับรุ่นเรือธง DeepSeek V4 รุ่นใหม่ทีมงาน DeepSeek ได้เผยแพร่เอกสารทางวิชาการฉบับใหม่อย่างเงียบ ๆ เอกสารฉบับใหม่นี้แนะนําระบบการอนุมานที่เป็นนวัตกรรมใหม่ที่เรียกว่า DualPath ซึ่งได้รับการปรับให้เหมาะสมโดยเฉพาะสําหรับประสิทธิภาพการอนุมานแบบจําลองขนาดใหญ่ (LLM) ภายใต้ปริมาณงานของตัวแทน ด้วยการแนะนํากลไก “KV-Cache การอ่านแบบสองเส้นทาง (คล้ายกับแคชหน่วยความจํา)” เพื่อกระจายโหลดเครือข่ายการจัดเก็บข้อมูลใหม่ปริมาณงานการอนุมานแบบออฟไลน์จะเพิ่มขึ้นสูงสุด 1.87 เท่าและจํานวนตัวแทนที่ทํางานต่อวินาทีของบริการออนไลน์จะเพิ่มขึ้นโดยเฉลี่ย 1.96 เท่า เอกสารดังกล่าวกล่าวถึงในบทนําว่าโมเดลขนาดใหญ่กําลังพัฒนาอย่างรวดเร็วจากหุ่นยนต์สนทนารอบเดียวและโมเดลการให้เหตุผลอิสระไปสู่ระบบตัวแทนที่สามารถวางแผนเรียกใช้เครื่องมือและแก้ปัญหาในทางปฏิบัติได้โดยอัตโนมัติผ่านการโต้ตอบหลายรอบ การเปลี่ยนแปลงในกระบวนทัศน์แอปพลิเคชันนี้ได้ผลักดันการเปลี่ยนแปลงครั้งใหญ่ในปริมาณงานการอนุมานแบบจําลองขนาดใหญ่: ตั้งแต่ปฏิสัมพันธ์ระหว่างมนุษย์กับโมเดลขนาดใหญ่แบบดั้งเดิมไปจนถึงการโต้ตอบระหว่างมนุษย์กับโมเดลขนาดใหญ่และสภาพแวดล้อมรอบการโต้ตอบสามารถเข้าถึงหลายสิบหรือหลายร้อยรอบ

ดูต้นฉบับ
news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น