OpenAI Traces Goblin Problem to Nerdy Personality Reward Signal, Goblin упоминает всплеск на 175% в GPT-5.1

Согласно OpenAI, компания выявила коренную причину «гоблинской» проблемы, которая преследовала модели GPT начиная с GPT-5.1. Сигнал вознаграждения, использовавшийся для усиления черты характера «Nerdy», поощрял выводы с упоминаниями фантастических существ: 76,2% обучающего набора данных демонстрировали эту предвзятость. При этом личность «Nerdy» составляла лишь 2,5% ответов ChatGPT, но при этом обеспечивала 66,7% упоминаний гоблинов, причем число таких упоминаний выросло на 3 881% с GPT-5.2 до GPT-5.4.

OpenAI убрала личность «Nerdy» в марте, исключила предвзятый сигнал вознаграждения и отфильтровала данные обучения. Компания также добавила инструкции по подавлению в разработческие подсказки GPT-5.5 в Codex. В ходе расследования были разработаны новые инструменты аудита поведения моделей.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Forefront Tech завершает $100M ценообразование IPO, чтобы выйти на Nasdaq

Согласно ChainCatcher, Forefront Tech Holdings Acquisition Corp завершила ценообразование IPO на сумму 100 миллионов долларов 30 апреля; торги планируется начать на Nasdaq под тикером FTHAU. Полученные средства будут использованы для изучения возможностей для сделок по слияниям и поглощениям в блокчейне, искусственном интеллекте, финтехе и других

GateNews20м назад

Бывший руководитель Meta привлекает средства для стартапа в сфере ИИ Flourish при оценке в $2,5B

По данным Bloomberg, Томас Рирдон, бывший руководитель Meta, который возглавлял работу над Neural Band в Meta, собирает средства для Flourish — нового AI-стартапа, ориентированного на системы низкопотребляющего ИИ. Lux Capital и Google Ventures договорились стать ключевыми инвесторами: уже есть участники, которые обязались вложить 500 миллионов долларов при оценке 2,5

GateNews22м назад

Стоимость GPU Nvidia Blackwell удваивается, но расходы на инференс (обработку одного токена) снижаются в 35 раз по сравнению с Hopper

Согласно последнему блогу-аналитике Nvidia, GPU Blackwell обходятся почти вдвое дороже в час по сравнению с поколением Hopper, но при этом обеспечивают в 35 раз более низкие затраты на инференс на токен. В качестве тестовой модели используется DeepSeek-R1: Blackwell (GB300 NVL72) сдается по $2,65 за GPU в час против $1,41 у Hopper, однако на одном GPU

GateNews56м назад

Parallel Web Systems привлекла $100M раунд Series B на оценке $2B , во главе — Sequoia

Согласно TechCrunch, Parallel Web Systems, стартап в сфере ИИ, основанный бывшим CEO Twitter Парагом Агарвалом, привлёк $100 миллионов в раунде серии B под руководством Sequoia при оценке в $2 миллиарда. Раунд доводит общий объём финансирования компании до $230 миллионов, через пять месяцев после её раунда серии A на $100 миллионов. Parallel

GateNews1ч назад

Ужин по случаю 8-й годовщины BitMart Exchange: внедрение для пользователей из Тайваня AI-автоматизации торговли и локализованных сервисов

BitMart провёл в Taipei Grand Hotel (君品酒店) ужин по случаю 8-летия биржи: присутствовали более 150 гостей, подведены итоги восьми лет развития и объявлены локализация и AI-стратегии автоматизированной торговли. BitMart Skill в связке с Blave позволяет пользователям без программирования автоматически торговать с помощью AI и получать мгновенные аналитические инсайты. Глобальная база пользователей превысила 13 миллионов, количество запущенных продуктов — более 4 800, объём торгов — свыше 1 триллиона долларов. На вечере были живой Бог богатства и щедрые подарки, что демонстрирует решимость глубоко развивать направление на Тайване.

ChainNewsAbmedia1ч назад

SoftBank планирует в 2026 году вывести на биржу Roze с целевой оценкой в 100 млрд долларов

По данным эксклюзивного сообщения Financial Times (FT) от 30 апреля, SoftBank планирует разделить бизнес в США и создать новую независимую компанию под названием Roze. Компания будет заниматься AI-роботами и инфраструктурой дата-центров; цель — завершить IPO не позднее 2026 года, при этом целевая оценка установлена на уровне 100 млрд долларов. Financial Times также сообщила, что внутри SoftBank есть сомнения относительно целевой оценки и сроков IPO.

MarketWhisper1ч назад
комментарий
0/400
Нет комментариев