Di antara artikel yang Anda baca dan iklan di sebelahnya, sedang berlangsung perang diam-diam untuk mendapatkan perhatian mata Anda. Kebanyakan iklan tampilan kehilangan perhatian karena orang benar-benar tidak suka iklan—sangat sehingga perusahaan teknologi besar seperti Perplexity atau Anthropic berusaha menjauh dari beban invasif tersebut, mencari model monetisasi yang lebih baik. Namun sebuah alat AI baru dari peneliti di University of Maryland dan Tilburg University ingin mengubah itu—dengan memprediksi, dengan akurasi yang mengganggu, apakah Anda benar-benar akan melihat iklan sebelum orang lain menempatkannya di sana. Alat ini disebut AdGazer, dan bekerja dengan menganalisis baik iklan itu sendiri maupun konten halaman web di sekitarnya—kemudian meramalkan berapa lama seorang penonton biasanya akan menatap iklan dan logo merek berdasarkan data historis penelitian iklan yang luas.
Tim melatih sistem ini menggunakan data pelacakan mata dari 3.531 iklan tampilan digital. Orang nyata mengenakan perangkat pelacakan mata, menjelajah halaman, dan pola pandang mereka direkam. AdGazer belajar dari semua itu. Ketika diuji pada iklan yang belum pernah dilihat sebelumnya, alat ini memprediksi perhatian dengan korelasi 0,83—yang berarti ramalannya sesuai dengan pola pandang manusia nyata sekitar 83% dari waktu. Berbeda dengan alat lain yang fokus pada iklan itu sendiri, AdGazer membaca seluruh halaman di sekitarnya. Sebuah artikel berita keuangan di samping iklan jam tangan mewah berperilaku berbeda dibandingkan iklan jam tangan yang sama di samping ticker skor olahraga. Konteks sekitar, menurut studi yang diterbitkan dalam Journal of Marketing, menyumbang setidaknya 33% dari perhatian yang didapat iklan—dan sekitar 20% dari berapa lama penonton melihat merek secara khusus. Itu adalah hal besar bagi pemasar yang selama ini menganggap bahwa kreativitas iklan sendiri yang melakukan semua pekerjaan berat.
Sistem ini menggunakan model bahasa besar multimodal untuk mengekstrak topik tingkat tinggi dari iklan dan konten halaman di sekitarnya, lalu menentukan seberapa baik kecocokan semantisnya—dasarnya iklan itu sendiri versus konteks tempat iklan tersebut ditempatkan. Embedding topik ini kemudian dimasukkan ke dalam model XGBoost, yang menggabungkannya dengan fitur visual tingkat rendah untuk menghasilkan skor perhatian akhir. Para peneliti juga membangun antarmuka, Gazer 1.0, di mana Anda dapat mengunggah iklan Anda sendiri, menggambar kotak pembatas di sekitar merek dan elemen visual, dan mendapatkan waktu pandang yang diprediksi dalam detik—bersama heatmap yang menunjukkan bagian mana dari gambar yang menurut model akan menarik perhatian paling banyak. Ini berjalan tanpa memerlukan perangkat keras khusus, meskipun pencocokan topik berbasis LLM lengkap masih memerlukan lingkungan GPU yang belum terintegrasi ke dalam demo publik. Untuk saat ini, ini adalah alat akademik. Tapi arsitekturnya sudah ada. Celah antara demo penelitian dan produk teknologi iklan produksi diukur dalam bulan—bukan tahun.