Повідомлення Gate News, 23 квітня — Дослідники Google, зокрема Хе Каймінг і Сіє Сайнгін, опублікували статтю, в якій представили Vision Banana — універсальну модель розуміння зору, створену шляхом легкого інструктивного доопрацювання (instruction fine-tuning) моделі для генерації зображень Nano Banana Pro (Gemini 3 Pro Image) компанії. Ключова інновація уніфікує виходи всіх задач зору як RGB-зображення, даючи змогу виконувати сегментацію, оцінювання глибини та прогнозування нормалей поверхні через генерацію зображень без спеціалізованих архітектур чи функцій втрат.

У семантичній сегментації Vision Banana перевершила спеціалізовану модель SAM 3 на 4,7 відсоткового пункту на Cityscapes; у сегментації за виразом (referring expression segmentation) вона випередила SAM 3 Agent. Однак у задачах сегментації екземплярів вона відставала від SAM 3. Для 3D-завдань метричне оцінювання глибини досягло 0,929 середньої точності на чотирьох стандартних наборах даних, перевищивши 0,918 Depth Anything V3, використовуючи лише синтетичні дані без реальної інформації про глибину або параметрів камери під час інференсу. Оцінювання нормалей поверхні досягло результатів на рівні найсучасніших у трьох внутрішніх бенчмарках.

Доопрацювання передбачало мінімальні дані з задач зору, змішані з початковим тренуванням генерації зображень, що зберегло здатність моделі до генерації — продуктивність відповідала оригінальній Nano Banana Pro в тестах якості генерації. У статті пропонується, що попереднє навчання (pretraining) генерації зображень у візії подібне до попереднього навчання генерації тексту в мові: моделі вчаться внутрішнім представленням, потрібним для розуміння зображень, під час генерації, а інструктивне доопрацювання лише вивільняє цю здатність.

Переглянути джерело

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Samsung SDS розширює партнерство з Google Cloud, щоб обслуговувати регульовані сектори за допомогою сервісів ШІ та безпеки

Новини індустрії ШІ

Повідомлення Gate News, 23 квітня — Samsung SDS розширила свою партнерську співпрацю з Google Cloud, щоб надавати послуги з ШІ, хмарних обчислень і безпеки для регульованих галузей, зокрема державного сектору та фінансових послуг. Компанії розгортатимуть Google Distributed Cloud для клієнтів, яким потрібні локалізація даних

GateNews3хв. тому

Sullivan & Cromwell вибачається за галюцинації ШІ в судовому документі з 40 хибними посиланнями

Новини індустрії ШІ

Повідомлення Gate News від 23 квітня — Sullivan & Cromwell, велика юридична фірма з Волл-стріт, вибачилася перед федеральним суддею після подання судового документа, який містив приблизно 40 неправильних посилань та інші помилки, спричинені галюцинаціями ШІ. Ендрю Дітдеріх, співкерівник глобальної команди з реструктуризації фірми,

GateNews19хв. тому

Tencent випускає та відкрито розміщує у відкритому доступі прев’ю Hunyuan Hy3 з 295B параметрів

Новини індустрії ШІ

Повідомлення Gate News, 23 квітня — Tencent представила та відкрито розмістила у відкритому доступі прев’ю Hunyuan Hy3, гібридну модель мовлення типу mixture-of-experts із поєднанням швидкого та повільного мислення. Модель має 295 мільярдів загальних параметрів і 21 мільярд активних параметрів, підтримує максимальну довжину контексту 256K

GateNews33хв. тому

Південна Корея та В’єтнам підписали 70+ меморандумів про взаєморозуміння щодо ШІ, енергетики та інфраструктури даних

Новини індустрії ШІ

Повідомлення Gate News, 23 квітня — Південна Корея та В’єтнам підписали понад 70 меморандумів про взаєморозуміння (MOUs) під час державного візиту президента Лі Чже Мьона до Ханоя 23 квітня. Документи охоплюють ШІ, енергетику, інфраструктуру та телекомунікації. Діловий форум, у якому взяли участь понад 500 керівників, обговорив екосистеми ШІ та енергетичної галузі, причому були представлені провідні корейські конгломерати, зокрема Samsung, SK, LG і Hyundai. A business forum attended by over 500 executives discussed AI an

GateNews33хв. тому

Колективне забруднення AI-движка для відповідей: у правильних відповідях Gemini 3 56% не мають підтримки з джерел

Новини індустрії ШІ

Цей текст стверджує, що під час запитів до AI-движка відповідей він одразу цитує вебсторінки; якщо джерело є згенерованим AI або бракує доказів, це забруднює результати. Немає потреби додатково навчати, щоб це запрацювало — це називається забрудненням під час пошуку (retrieval contamination). Хоча Gemini3 має високу точність, 56% відповідей не мають перевірюваних джерел; приклади Lily Ray, Grokipedia тощо показують, що AI легко обманюється вигаданим контентом. Висновок полягає в тому, що шар цитування та надійні автори від’єднуються, утворюючи цикл самопідсилюваного забруднення; користувачі все ще повинні повертатися до первинних джерел і не сприймати відповідь як кінцеву точку для перевірки фактів.

ChainNewsAbmedia41хв. тому

Anthropic повідомляє суд, що розгорнуті в Пентагоні моделі ШІ не мають "kill switch"

Новини індустрії ШІ

Повідомлення Gate News, 23 квітня — Anthropic подала подання до Апеляційного суду США у Південному окрузі округу Колумбія, заявивши, що щойно її моделі ШІ будуть розгорнуті в середовищах Пентагону, компанія не має ані видимості, ані технічних засобів для контролю або зупинки моделей, і не існує жодного "kill switch"

GateNews43хв. тому

Прокоментувати

0/400

Немає коментарів