2025_NIPS_Online Ad Procurement in Non-stationary Autobidding Worlds

原创于 2026-06-25 07:30:00 发布 · 4 阅读

·

0

·

标签

#人工智能 #深度学习

LLM Daily 同时被 2 个专栏收录

2865 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

919 篇文章

订阅专栏

文章核心总结与翻译

一、主要内容

文章聚焦非平稳自动竞价环境下的在线广告采购优化问题，针对广告主面临的高维决策、长期约束、有限反馈及环境动态变化四大挑战，构建了统一的在线学习框架。通过将广告杠杆决策建模为带有限臂反馈和不确定长期约束的在线凸优化问题，提出融合对偶下降、原始上升、专家权重算法和约束校验的 primal-dual 算法，可适配随机、对抗性、受扰、周期性和遍历性五种非平稳环境，无需预先知晓环境类型，同时证明了算法在各类环境下的低遗憾界，并拓展了该框架在个性化推荐、动态定价等其他领域的应用。

二、创新点

首次为实际非平稳自动竞价场景建模，涵盖五种典型环境，且支持高维杠杆决策（突破现有单维决策局限）。
提出通用约束型有限臂优化算法，通过四大核心设计（解耦时间决策、处理有限反馈、自适应步长、保障约束满足）实现跨环境稳健性能。
理论上证明算法在五种环境下均能达到合理遗憾界，填补了非平稳环境下高维约束型在线优化的研究空白。
算法具备普适性，可迁移至个性化推荐、云服务定价等多个在线决策场景。

三、关键部分翻译（Markdown格式）

Abstract（摘要）

如今，在线广告主通过与自动竞价平台交互来采购数字广告曝光：广告主通过设置预算、目标投资回报率、最高点击成本等控制杠杆，传达高层级采购目标。之后，广告平台代表广告主进行曝光采购，并向广告主报告最终的采购转化

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。