





近日,快手首次提出生成式强化学习(Generative Model for RL,G4RL)出价技术,有效结合生成模型和强化学习。让广告出价既能够优化序列整体价值,又能更好地利用出价历史序列信息。2025年至今,快手将其全面落地在广告系统,为平台实现了超过3% 的广告收入提升。#快手技术 #大模型 #广告出价 #强化学习
? 核心亮点:
✅ 突破传统出价模型局限
✅ 兼顾长期价值与实时决策
✅ 已验证大规模落地成效
更多信息可查看论文:
论文名称:Generative Auto-Bidding with Value-Guided Explorations
论文链接:https://arxiv.org/pdf/2504.14587
论文名称:Generative Auto-Bidding in Large-Scale Competitive Auctions via Diffusion Completer-Aligner
论文链接:https://arxiv.org/pdf/2509.03348
? 核心亮点:
✅ 突破传统出价模型局限
✅ 兼顾长期价值与实时决策
✅ 已验证大规模落地成效
更多信息可查看论文:
论文名称:Generative Auto-Bidding with Value-Guided Explorations
论文链接:https://arxiv.org/pdf/2504.14587
论文名称:Generative Auto-Bidding in Large-Scale Competitive Auctions via Diffusion Completer-Aligner
论文链接:https://arxiv.org/pdf/2509.03348


