Исследователи OpenAI: системы ИИ могут справиться с большей частью исследовательской работы в течение двух лет

Сообщение Gate News, 29 апреля — исследователи OpenAI Сэбастьен Бьюбек и Эрнест Рю заявляют, что системы ИИ смогут выполнять большую часть человеческой исследовательской работы в течение двух лет, представляя математику как четкий показатель прогресса ИИ. В отличие от расплывчатых тестов производительности, математические задачи дают точную верификацию: ответы либо правильные, либо неправильные, не оставляя места для двусмысленности.

Бьюбек отметил, что истинное мышление ИИ требует способности выдерживать длинные цепочки рассуждений. Одна ошибка в многошаговом аргументе рушит все доказательство, делая обнаружение и исправление ошибок по ходу процесса главной целью для продвинутых моделей. Внутренние лаборатории OpenAI уже сгенерировали более десяти полностью новых теорем, пригодных для публикации в ведущих журналах по комбинаторике, демонстрируя, что ИИ теперь создает действительно оригинальные, прорывные работы, выходя за рамки простого комбинирования уже существующих статей.

Однако устойчивые научные прорывы требуют постоянного сосредоточения на протяжении недель тестирования. Текущие системы все еще нуждаются в строгом человеческом надзоре, чтобы направлять и проверять каждую смену курса. Бьюбек использует выражение “время для достижения AGI” (AGI time), чтобы измерить, как долго модель может независимо имитировать человеческое мышление; текущие системы работают примерно от нескольких дней до одной недели, а цель индустрии — недели или месяцы, чтобы обеспечить автономную работу в таких областях, как биология.

Долговременная память критически важна для этого будущего. Обычные окна чата ограничивают глубину — сложные математические доказательства часто превышают 50 страниц — тогда как репозитории кода показывают, как расширенные сессии работы позволяют вести более глубокое решение задач. По мере того как ИИ получает больше независимости и памяти, человеческая экспертиза становится более ценной, а не менее. Работникам нужно сохранять глубокие базовые знания, чтобы оспаривать и верифицировать ответы машины, а организациям потребуются новые автоматизированные фильтры и системы репутации, чтобы поддерживать доверие в условиях потока научных исследований, дополненных ИИ.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

AI-платформа Certifyde привлекает $2M в посевном финансировании вместе с CEO Ripple Брэдом Гарлингхаусом

Согласно ChainCatcher, платформа для AI-приложений Certifyde объявила о завершении раунда посевного финансирования на сумму $2 миллионов долларов. Инвесторы включают K5 Global, Flamingo Capital, а также бизнес-ангелов, таких как CEO Ripple Брэд Гарлингхаус, сооснователь Honey Джордж Руань и сооснователь Nutra Роланд

GateNews12м назад

DeepSeek запускает функцию распознавания изображений в бета-тестировании

Согласно PANews, сегодня DeepSeek запустила функцию распознавания изображений (29 апреля), в настоящее время она находится на бета-тестировании. Для развертывания бета-версии могут быть выбраны как пользователи веб-версии, так и мобильного приложения.

GateNews1ч назад

Anthropic Запускает 8 Коннекторов для Творческих Инструментов для Claude, Включая Blender, Adobe, Autodesk

Anthropic объявила набор коннекторов для творческих инструментов, которые позволяют Claude напрямую управлять профессиональным программным обеспечением, используемым дизайнерами и музыкантами. Первые восемь коннекторов охватывают 3D-моделирование, визуальный дизайн, музыкальное продакшн и живые выступления, а партнёрами выступают Blender, Adobe,

GateNews1ч назад

Белый дом обходит оценку рисков Пентагона, чтобы развернуть модель Mythos от Anthropic 29 апреля

Согласно Whale Factor, Белый дом обходит оценку рисков Пентагона, чтобы развернуть модель Mythos от Anthropic во всех федеральных ведомствах 29 апреля. Этот шаг направлен на ускорение возможностей федерального ИИ и на то, чтобы идти в ногу с темпами децентрализованных ИИ-сетей. Это означает существенный сдвиг

GateNews1ч назад

Cognizant приобретет Astreya за $600M , чтобы расширить бизнес по развитию инфраструктуры ИИ

По данным Reuters, 29 апреля Cognizant согласилась приобрести Astreya примерно за $600 миллиона, поскольку расширяет свой бизнес по развитию инфраструктуры ИИ. Astreya — поставщик ИТ-услуг, специализирующийся на инфраструктуре ИИ и услугах дата-центров. Ожидается, что сделка будет завершена во втором квартале

GateNews1ч назад

30 вредоносных плагинов на ClawHub, замаскированных под AI-инструменты, скачаны более 9 800 раз

Согласно исследователю Manifold Акс Шарме, 30 плагинов на ClawHub, замаскированных под легитимные AI-инструменты, были скачаны более 9 800 раз, при этом тайно превращая AI-ассистентов пользователей в криптовалютных работников. Плагины, опубликованные под аккаунтом imaflytok, выглядят как обычные планировщики задач и инструменты мониторинга, однако содержат скрытые инструкции, которые выполняют несанкционированные операции. После установки плагины автоматически регистрируют AI-ассистентов пользователей на сторонних серверах, создают криптовалютные кошельки и извлекают приватные ключи без согласия и уведомления пользователя. Затем ассистенты выходят на связь каждые 4 часа в ожидании назначенных задач. Шарма отметил, что плагины не содержат вредоносного кода, который можно обнаружить с помощью сканеров безопасности: они используют только стандартные интерфейсы и легитимные инструменты, из-за чего их сложно выявить при обычных проверках безопасности.

GateNews1ч назад
комментарий
0/400
Нет комментариев