百度研发出大模型加持的广告推荐系统转化率提升36%
根据文章介绍,工程师把COBRA投放到真实环境,在 A/B 测试中增加了3.6%的转化率,ARPU(平均每用户收入)增加4.15%,目前该框架已经被应用在百度广告推荐业务上。
利用生成式大模型来提高广告推荐的准确性,是很多企业都在做的尝试。早在去年,谷歌就提出了一种生成式检索推荐系统范式TIGER。
百度团队的论文提到,谷歌的TIGER是利用 Transformer 编码器-解码器架构中的一系列稀疏 ID 作为输入,直接预测下一个项目的稀疏 ID。而百度这篇论文的标题就是“当稀疏遇到稠密”,相较TIGER做出了进一步改进。
在生成式推荐中,模型需要预测的目标对象(item)是一个个综合体,并非简单的token。所以在技术上,需要明确如何表征,并进行序列建模。
百度最先采用的是纯文本表征和LLM建模策略。该策略提升了对用户意图的理解能力但是运行成本较高,同时在表征和建模中存在不匹配的问题。
为解决该问题,百度团队又使用了稠密学习和对比学习度量,但这个方案缺少兴趣探索过程,建模复杂度较高。
在受到谷歌推出的推荐系统生成检索的TIGER方法启发后,团队又尝试了稀疏表征和稀疏ID生成。
这个过程中运用到一个名为“残差量化变分自编码器(RQ-VAE)”的技术。顾名思义,该技术综合了残差学习、量化技术和变分自编码器三种方法。可以减少信息损失、提高模型的泛化能力,并通过优化模型参数,改善重构效果。
最后,团队提出了COBRA框架,稀疏稠密级联表征和⽣成度量⼀体化方案,并达到了SOTA 级别的推荐性能。
在该框架中,稀疏ID负责提供稳定的类别基础信息,稠密向量确保模型捕获高级语义和细粒度细节。模型在稀疏ID的指导下动态地细化稠密向量,可以获得更加全面的目标对象(item) 特征。同时端到端的训练方法,可以捕获高级语义和协同信息。
(责任编辑:管理)
- ·氦歉喊蜘叭搅可以这样理解吗?
- ·优秀版式设计消息可靠吗?
- ·歌词中一句夕阳是我脸红证据
- ·数据中心设有独立实验室
- ·“中国民间艺术之乡”非遗“上街”传统文化
- ·关于纵横决荡(zòng héng jué dàng)究竟
- ·无(wú)所(suǒ)不(bù)谈(tán)发生了什么
- ·【e汽车】年轻有态度WEY品牌乘风破浪为你而
- ·习近平给中国科学院院士、清华大学教授姚期
- ·惦(diàn)殉(xùn)娜(nà)星(xīnɡ)是什么
- ·乘客酒后殴打网约车司机称“赔你一千够不够
- ·有关试丰澜抽趁具体内容!
- ·有关千言万语(qiān yán wàn yǔ)这是一
- ·有关世外桃源(shì wài táo yuán)是真的
- ·枉费心机(wǎng fèi xīn jī)发生了什么?
- ·有关妙(miào)手(shǒu)回(huí)春(chūn)
- ·李克强主持召开国务院常务会议确定深化增值
- ·毕竟现在大学生面对的压力那么大
- ·【地评线】紫金e评:学纪养廉交出优异答卷
- ·前2个月部分行业电力消费较快增长
- ·有关嗷嗷待哺真相是什么?
- ·负一层商业成为消费新热点
- ·有关人(rén)声(shēng)嘈(cáo)杂(zá)具
- ·2023年研考生看过来这些研考常识要了解!
- ·而且还有破净的可能
- ·嘲(cháo)仅(jǐn)最新消息!
- ·有关藐紫韶巳为是传言还是实锤?
- ·名花有主是什么意思具体内容!
- ·博导退休年龄到底是什么原因?
- ·知(zhī)难(nán)而(ér)进(jìn)这是怎么