Кратко
Где-то между статьей, которую вы читаете, и рекламой рядом с ней ведется тихая война за ваши глаза. Большинство дисплейных объявлений теряют внимание, потому что люди просто ненавидят рекламу — настолько, что крупные технологические компании, такие как Perplexity или Anthropic, пытаются уйти от этих навязчивых нагрузок, ищут лучшие модели монетизации. Но новый инструмент на базе ИИ от исследователей из Университета Мэриленда и Тилбургского университета хочет изменить это — предсказывая с тревожной точностью, будете ли вы действительно смотреть на рекламу, прежде чем кто-либо решит разместить ее там. Инструмент называется AdGazer, и он работает, анализируя как саму рекламу, так и содержимое страницы вокруг нее — затем прогнозирует, как долго типичный зритель будет смотреть на рекламу и логотип бренда, основываясь на обширных исторических данных исследований рекламы.
Команда обучила систему на данных отслеживания взгляда 3531 цифровой дисплейной рекламы. Реальные люди носили оборудование для отслеживания взгляда, просматривали страницы, и их паттерны взгляда записывались. AdGazer учился на всем этом. При тестировании на рекламе, которую он никогда раньше не видел, он предсказал внимание с коэффициентом корреляции 0,83 — что означает, что его прогнозы совпадали с реальными паттернами взгляда человека примерно в 83% случаев. В отличие от других инструментов, сосредоточенных только на самой рекламе, AdGazer анализирует всю страницу вокруг нее. Финансовая статья рядом с рекламой роскошных часов ведет себя иначе, чем та же реклама часов рядом со спортивным счетчиком. Контекст вокруг, согласно исследованию, опубликованному в Journal of Marketing, составляет как минимум 33% от того, сколько внимания получает реклама, и около 20% — от того, как долго зрители смотрят именно на бренд. Это важный момент для маркетологов, которые давно полагали, что вся тяжелая работа — за креативом.
Система использует мультимодальную модель большого языка для извлечения высокоуровневых тем как из самой рекламы, так и из содержимого страницы, затем определяет, насколько хорошо они соответствуют семантически — по сути, реклама сама по себе против контекста, в который она помещена. Эти векторные представления тем поступают в модель XGBoost, которая объединяет их с низкоуровневыми визуальными признаками для получения окончательного балла внимания. Исследователи также создали интерфейс Gazer 1.0, где можно загрузить свою рекламу, обвести рамками бренд и визуальные элементы, и получить предсказанное время взгляда в секундах — вместе с тепловой картой, показывающей, какие части изображения, по мнению модели, привлекут наибольшее внимание. Он работает без необходимости специализированного оборудования, хотя полное сопоставление тем с помощью LLM все еще требует GPU-среды, которая пока не интегрирована в публичную демонстрацию. На данный момент это академический инструмент. Но архитектура уже есть. Разрыв между исследовательской демонстрацией и производственным продуктом в области рекламных технологий измеряется месяцами — не годами.