DeepSeek випустила DeepSeek-OCR 2, штучний інтелект може "бачити" зображення у такій самій логічній послідовності, як і людина

PANews повідомив 27 січня, що DeepSeek випустила нову модель DeepSeek-OCR 2, яка використовує інноваційний метод DeepEncoder V2, що дозволяє штучному інтелекту динамічно переставляти частини зображення відповідно до його значення, а не просто механічно сканувати зліва направо. Цей підхід імітує логічний потік, за яким люди слідують під час перегляду сцени. Зрештою, модель перевершує традиційні моделі мови зору при обробці зображень із складними макетами, такими як документи чи діаграми, що дозволяє більш інтелектуальне та причинне розуміння візуального розуміння.

Переглянути оригінал
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів