文章核心总结与翻译
一、主要内容
文章聚焦非平稳自动竞价环境下的在线广告采购优化问题,针对广告主面临的高维决策、长期约束、有限反馈及环境动态变化四大挑战,构建了统一的在线学习框架。通过将广告杠杆决策建模为带有限臂反馈和不确定长期约束的在线凸优化问题,提出融合对偶下降、原始上升、专家权重算法和约束校验的 primal-dual 算法,可适配随机、对抗性、受扰、周期性和遍历性五种非平稳环境,无需预先知晓环境类型,同时证明了算法在各类环境下的低遗憾界,并拓展了该框架在个性化推荐、动态定价等其他领域的应用。
二、创新点
- 首次为实际非平稳自动竞价场景建模,涵盖五种典型环境,且支持高维杠杆决策(突破现有单维决策局限)。
- 提出通用约束型有限臂优化算法,通过四大核心设计(解耦时间决策、处理有限反馈、自适应步长、保障约束满足)实现跨环境稳健性能。
- 理论上证明算法在五种环境下均能达到合理遗憾界,填补了非平稳环境下高维约束型在线优化的研究空白。
- 算法具备普适性,可迁移至个性化推荐、云服务定价等多个在线决策场景。
三、关键部分翻译(Markdown格式)
Abstract(摘要)
如今,在线广告主通过与自动竞价平台交互来采购数字广告曝光:广告主通过设置预算、目标投资回报率、最高点击成本等控制杠杆,传达高层级采购目标。之后,广告平台代表广告主进行曝光采购,并向广告主报告最终的采购转化

订阅专栏 解锁全文

25

被折叠的 条评论
为什么被折叠?



