OpenAI 研究人员:AI 系统或可在两年内处理大部分研究工作

Gate News 信息,4 月 29 日 — OpenAI 研究人员 Sébastien Bubeck 和 Ernest Ryu 表示,AI 系统或可在两年内完成大部分人类研究工作,并将数学呈现为衡量 AI 进展的清晰指标。与模糊的性能测试不同,数学问题提供精确的验证:答案要么正确要么错误,不留任何歧义空间。

Bubeck 指出,真正的 AI 思考需要能够穿越冗长的推理链条。在多步骤论证中出现一个错误,就会使整个证明崩塌,因此,对于先进模型而言,过程中的错误检测与纠正才是最终目标。OpenAI 的内部实验室已经生成了超过十个全新的、可发表在顶级组合数学期刊上的定理,表明 AI 现在能够产出真正原创、具有突破性的工作,而不仅仅是重新组合既有论文。

然而,持续的科学突破要求在数周的测试中保持稳定的专注。当前系统仍需要严格的人类监督,以引导并核验每一次方向的调整。Bubeck 使用 “AGI 时间” 来衡量一个模型能独立模仿人类思考多久;当前系统大致运行在数天到一周的量级,而行业目标是以数周或数月的时间框架,来让自主工作在生物等领域成为可能。

长期记忆对这一未来至关重要。标准聊天窗口会限制深度——复杂的数学证明往往超过 50 页——而代码仓库则展示了延长的工作会话如何带来更深入的问题求解。随着 AI 逐步获得独立性并建立记忆,人类专业知识的价值将变得更高,而不是更低。工作者必须保留扎实的深层基础知识,以挑战并核验机器给出的答案;组织则需要新的自动化过滤器与声誉系统,以便在充斥 AI 辅助研究的洪流中维持信任。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

DeepSeek 在测试版中推出图像识别功能

据 PANews 报道,DeepSeek 今日推出其图像识别功能 (4月29日),目前处于测试版。网页端和移动端应用的用户都可能被选中参与测试版推送。

GateNewsمنذ 58 د

تطلق Anthropic 8 موصلات لأدوات إبداعية لـ Claude، بما في ذلك Blender وAdobe وAutodesk

أعلنت شركة Anthropic عن مجموعة من موصلات الأدوات الإبداعية التي تمكّن Claude من التحكم مباشرةً في البرامج الاحترافية المستخدمة من قِبل المصممين وعازفي الموسيقى. تغطي الموصلات الثمانية الأولى مجالات نمذجة ثلاثية الأبعاد، والتصميم البصري، وإنتاج الموسيقى، والعروض الحية، مع شركاء من بينهم Blender وAdobe,

GateNewsمنذ 59 د

البيت الأبيض يتجاوز تقييم مخاطر البنتاغون لنشر نموذج Anthropic Mythos في 29 أبريل

وفقًا لـ Whale Factor، تتجاوز إدارة البيت الأبيض تقييم المخاطر التابع للبنتاغون لنشر نموذج Mythos من Anthropic عبر الوكالات الفيدرالية في 29 أبريل. يهدف هذا الإجراء إلى تسريع قدرات الذكاء الاصطناعي الفيدرالية ومطابقة وتيرة شبكات الذكاء الاصطناعي اللامركزية. ويمثل هذا تحولًا كبيرًا

GateNewsمنذ 1 س

Cognizant تستحوذ على Astreya مقابل $600M للتوسع في أعمال البنية التحتية للذكاء الاصطناعي

وفقًا لرويترز، في 29 أبريل، وافقت شركة Cognizant على الاستحواذ على Astreya مقابل ما يقرب من $600 مليون دولار، وذلك مع توسعها في مجال أعمال البنية التحتية للذكاء الاصطناعي. تعد Astreya مزودًا لخدمات تكنولوجيا المعلومات متخصصًا في البنية التحتية للذكاء الاصطناعي وخدمات مراكز البيانات. من المتوقع أن يتم إغلاق الصفقة في الربع الثاني

GateNewsمنذ 1 س

30 إضافة خبيثة على ClawHub متخفية كأدوات ذكاء اصطناعي، تم تنزيلها أكثر من 9,800 مرة

وفقًا لبحث الباحث في مانيفولد Ax Sharma، تم تنزيل 30 إضافة على ClawHub متخفية على هيئة أدوات ذكاء اصطناعي شرعية أكثر من 9,800 مرة، بينما كانت تقوم سراً بتحويل مساعدين الذكاء الاصطناعي لدى المستخدمين إلى عمال للعملات الرقمية. تظهر الإضافات، المنشورة تحت الحساب imaflytok، كأجهزة جدولة مهام روتينية وأدوات مراقبة، لكنها تحتوي على تعليمات مخفية تنفذ عمليات غير مصرح بها a

GateNewsمنذ 1 س

باراغ أغراوال يطلق Parallel لجولة $100M من الفئة B لبنية تحتية للبحث لوكلاء الذكاء الاصطناعي

وفقًا لـ Beating، أكملت شركة Parallel Web Systems، التي أسسها الرئيس التنفيذي السابق لـ Twitter باراغ أغراوال، جولة تمويل من الفئة B بقيمة $100 مليون بقيادة Sequoia Capital، مع تقييم الشركة عند $2 مليار. كما شاركت كل من Kleiner Perkins وIndex Ventures وKhosla Ventures. تأتي عملية التمويل بعد ستة أشهر من أن الشركة جمعت مليون في جولة الفئة A بتقييم قدره مليون، وهو ما أدى إلى تضاعف تقييمها بنحو ثلاث مرات. Parallel تبني بنية تحتية للبحث على الويب لوكلاء الذكاء الاصطناعي الذين يتعاملون مع مهام بحثية معقدة مثل تحليل الاستثمارات ومعالجة مطالبات التأمين. توظف الشركة حاليًا نحو 50 موظفًا وتخدم أكثر من 100,000 مطور. شركة الذكاء الاصطناعي القانونية Harvey، وهي عميل رئيسي، تستخدم بنية Parallel التحتية للتحكم في مواقع الويب التي يمكن للوكلاء الوصول إليها.

GateNewsمنذ 1 س
تعليق
0/400
لا توجد تعليقات