Alibaba відкриває у відкритому доступі модуль інтерпретованості Qwen-Scope для Qwen, який охоплює 7 моделей, станом на 30 квітня

GateNews

2026-04-30 09:24:06

За даними PANews, 30 квітня Alibaba Qwen оголосила про відкритий код Qwen-Scope — модуля інтерпретованості, натренованого на моделях серій Qwen3 і Qwen3.5. Випуск охоплює 7 великих мовних моделей у варіантах dense та mixture-of-experts, а також 14 наборів ваг sparse autoencoder.

Переглянути джерело

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

DeepSeek 30 квітня представив метод Visual Primitives для покращення мультимодальних міркувань

Новини індустрії ШІ

Згідно з технічним звітом DeepSeek, 30 квітня компанія представила Visual Primitives — метод, який вбудовує базові візуальні одиниці, зокрема точки та рамки, у ланцюжки міркувань, щоб вирішити проблему Reference Gap у мультимодальних завданнях. Метод зменшує споживання токенів зображень

GateNews3хв. тому

NVIDIA випустила ваги флагманської моделі Cosmos-Reason2-32B і розширила контекстне вікно до 256K токенів

Новини індустрії ШІ

За даними Beating, NVIDIA випустила ваги для Cosmos-Reason2-32B — флагманської версії її фізичного AI-міркувального vision-language-моделю (VLM), створеної для того, щоб роботи та системи автономного керування могли розуміти просторові, часові й фізичні принципи. Модель із 32 мільярдами параметрів,

GateNews5хв. тому

OpenAI пояснює, чому Codex забороняє згадувати «ґоблінів»: винагорода за «ботанський» характер вийшла з-під контролю

Новини індустрії ШІ

OpenAI у своєму офіційному блозі пояснила, що Codex забороняє “говоріння” про гоблінів та інших істот, і що причиною стали заохочувальні сигнали, які віддають перевагу біологічним метафорам під час тренування “ботанічного” характеру, що призвело до кросперсонального забруднення та помилкового спрямування RLHF. Подія спалахнула після того, як Barron Roth викрив системні інструкції; OpenAI застосувала дві стратегії — короткострокове жорстке хардкодування та довгострокове очищення заохочувальних сигналів — попереджаючи про вразливість дизайну нагород, а для посттренувальних аудитів потрібна точніша деталізація.

ChainNewsAbmedia49хв. тому

AI-сервери Nvidia B300 досягли 1 мільйона доларів у Китаї на тлі дефіциту поставок

Новини індустрії ШІ

За даними Reuters, сервери для AI Nvidia B300 тепер продаються в Китаї приблизно за 7 мільйонів юанів (1 мільйон доларів США), що зумовлено посиленням боротьби зі схемами контрабанди та збереженням попиту з боку місцевих технічних компаній. Ціна зросла з приблизно 4 мільйонів юанів (585 тисяч доларів США) наприкінці 2025 року, значно

GateNews1год тому

Операційний прибуток LG CNS зріс на 19% у 1 кварталі завдяки зростанню в сегментах AI та хмарних сервісів

Новини індустрії ШІ

Згідно з Chosun Daily, LG CNS повідомила 30 квітня, що операційний прибуток у першому кварталі зріс на 19,4% у річному вимірі до 94,2 мільярда вон (64,1 млн доларів США) завдяки попиту на AI та хмарні сервіси. Виручка зросла на 8,6% до 1,3 трильйона вон (894 млн доларів США). Підрозділ компанії з AI та хмарних сервісів згенерував 765,4 біллі

GateNews2год тому

OpenAI запустила GPT-5.5-Cyber: протистояння з Anthropic Mythos

Новини індустрії ШІ

OpenAI оголосила про запуск GPT-5.5-Cyber, спеціально створеного для кібербезпеки. Він буде розгорнутий у «найближчі кілька днів» через механізм довіреного доступу з урядовою координацією для ключових оборонних підрозділів, а не для відкритого продажу. Це контрастує з відкритим шляхом Anthropic Mythos: Білому дому не подобається розширення до 70 компаній. Preparedness Framework оцінив ситуацію як High (але не critical), водночас посилюючи захист кібербезпеки. Надалі стежитимуть за переліком під час розгортання, можливим включенням CISA та розбіжностями в обох сторін щодо стандартів безпеки.

ChainNewsAbmedia3год тому

Прокоментувати

0/400

Немає коментарів