简要介绍
在你阅读的文章和旁边的广告之间,正上演一场静悄悄的争夺你的目光的战争。大部分展示广告之所以失去效果,是因为人们讨厌广告——甚至如此厌恶,以至于像 Perplexity 或 Anthropic 这样的大型科技公司都在试图远离那些侵入性的广告,寻找更好的变现模式。 但来自马里兰大学和蒂尔堡大学的研究人员开发的一款新型人工智能工具,试图改变这一局面——通过令人不安的准确度预测,你是否会在广告被放置之前真正去看它。 该工具名为 AdGazer,它通过分析广告本身和其周围的网页内容,然后基于大量广告研究的历史数据,预测典型观众会盯着广告和品牌标志看多长时间。
团队在3,531个数字展示广告的眼动追踪数据上训练了该系统。真实用户佩戴眼动追踪设备,浏览网页,记录他们的凝视模式。AdGazer 从中学习。 在未曾见过的广告上测试时,它的注意力预测相关系数达到了0.83——意味着其预测与实际人类凝视模式的吻合度大约为83%。 与其他只关注广告本身的工具不同,AdGazer 会读取广告周围的整个页面内容。一个金融新闻文章旁的奢华手表广告,与同一手表广告旁的体育比分滚动条,表现完全不同。 根据发表在《市场营销杂志》上的研究,周围的内容至少占广告吸引注意力的33%,而且大约占观众专门注视品牌的时间的20%。这对于长期以来认为创意本身承担全部重任的营销人员来说,是一个重大发现。
该系统使用多模态大语言模型,从广告和周围页面内容中提取高级主题,然后判断它们在语义上的匹配程度——基本上是广告本身与其所处环境的关系。这些主题嵌入向量输入到 XGBoost 模型中,结合低层次的视觉特征,生成最终的注意力得分。 研究人员还开发了一个界面 Gazer 1.0,用户可以上传自己的广告,绘制品牌和视觉元素的边界框,获得以秒为单位的预测凝视时间——以及显示模型认为最吸引注意力部分的热图。该界面无需专用硬件即可运行,但完整的基于大语言模型的主题匹配仍需GPU环境,目前尚未集成到公开演示中。 目前它仍是一个学术工具,但架构已经搭建完毕。研究演示与生产级广告技术产品之间的差距,只有几个月——而非几年。