萝莉porn
bt核工厂地址 生成式拍卖:感知排列外部性的整页优化机制
你的位置:| 萝莉porn > 北条麻妃作品 > bt核工厂地址 生成式拍卖:感知排列外部性的整页优化机制

bt核工厂地址 生成式拍卖:感知排列外部性的整页优化机制

发布日期:2024-12-27 08:48    点击次数:193

bt核工厂地址 生成式拍卖:感知排列外部性的整页优化机制

The following article is from 阿里姆妈期间 Author 衡言bt核工厂地址

从"先预估后分拨"的判别式模范,到径直面向最终拍卖放弃的生成式模范,生成式模子能否为在线告白的拍卖机制优化带来合手续增量?

本文先容阿里姆妈展示告白机制战略团队在 AIGA(AI-Generated Auction)标的的前沿探索 - 生成式拍卖估量责任。

基于该项责任整理的论文已被KDD ’ 25 Research Track接受。

告白拍卖机制联想行动在线告白系统的蹙迫一环,在合手续优化告白主和平台收益方面起着至关蹙迫的作用。传统的广义二价拍卖(GSP)等拍卖机制依赖于点击率分离假定(将告白点击率拆分为告白自己质料分和告白位曝光权重的乘积),忽略了页面中同期展示的其它商品的影响,即外部性影响。

比年来,基于深度学习的拍卖机制显赫增强了对高维险阻文特征的编码才智,然而现存模范仍受限于"先预估后分拨"的联想范式。这种范式只可建模参竞告白联接内的外部性,无法捕捉最终分拨放弃的整页险阻文信息(即排列外部性),因此难以拘谨到全局最优解。本文系统分析了在排列外部性影响下的最优拍卖机制,在表面最优解的基础上,估量团队建议了首个使用生成式模子建模排列外部性的告白拍卖机制 - 生成式拍卖(Contextual Generative Auction, CGA)。

该框架通过自转头模子生成告白分拨放弃,并将引发兼容(Incentive Compatibility, IC)条目量化为最小化过后后悔(ex-post regret),收场端到端学习最优计费规矩。大范围离线实验和在线 A/B 实验标明 CGA 能显赫普及平台收入等要道方针,同期灵验迫临表面最优拍卖的放弃。

序文

在线告白系统的最优拍卖机制旨在最大化平台欲望收入,同期餍足经济学性质,包括引发兼容和个体感性(Individual Rationality, IR),况且需要餍足系统在线部署的筹谋时延要求。IC 条目要求告白主信得过报价最大化其自己效率,IR 条目要求告白主的效率非负。

在典型的点击计费(Cost-per-Click, CPC)多坑告白场景下,告白拍卖机制的成果依赖于对告白点击率(CTR)的预估准度。过去使用的 GSP 等机制使用精排阶段的单点预估 CTR,忽略了页面展示的其它商品的影响。而推行场景中,用户浏览的页面包括多个商品,用户在决策前时时会对不同商品进行比较,因此同期曝光的其它商品会对主见告白的 CTR 产生影响,称为"外部性" [ 1 ] 。

基于深度学习的拍卖机制,如 Deep Neural Auction(DNA [ 2 ] )和 Score Weighted VCG(SW-VCG [ 3 ] )等责任计议使用深度网罗形容外部性影响以普及平台收入。联系词无论是 DNA 遴荐的先预估告白 rankscore 再进行排序,如故 SW-VCG 使用的先预估单调性分数再求解二部图最大匹配,这些模范骨子上皆受到"先预估后分拨"(allocation-after-prediction)范式的局限,预估时的险阻文信息与分拨后的最终险阻文信息不一致,因此模子只可捕捉到粗粒度的告白候选集层面的外部性。另一方面,Neural Multi-slot Auction(NMA [ 4 ] )等机制遴荐访佛 VCG 拍卖的时势,遍历扫数可能的排列放弃以求解最优分拨,然而极高的筹谋复杂度使其难以诓骗于在线场景。

凭证 Myerson 拍卖表面 [ 5 ] ,拍卖机制的 IC 条目要求告白主获取的欲望价值对于其出价餍足非递减关系。大无数现存模范通过保证排序公式中出价的权重为正,使得告白主提进步价能获取换取或更前置的告白位。然而在排列外部性的影响下,即使告白候选集保合手不变,将告白分拨到的坑位前置反而可能导致其欲望价值下跌。图 1 给出了不同告白的分坑位 [ 点击率 * 曝光率 ] (默示 CPC 机制下的告白主欲望价值)的实验数据,二者的关系并不餍足单调性。因此,在排列外部性影响下,怎么联想餍足引发兼容条目的分拨规矩是一个非平庸的问题。

△图 1:告白分坑位 [ 点击率 * 曝光率 ]

本文旨在探索在排列外部性影响下,餍足 IC 和 IR 管制的收入最大化告白拍卖机制的基本样式和高效收场。咱们最初给出系统性的表面分析,解说最优解保留 Myerson 最优拍卖的基本样式,即分拨规矩和计费规矩不错进行解耦。在表面最优解的基础上,引入经典的生成器 - 评估器(Generator-Evaluator)架构,构建感知排列外部性的生成式拍卖。临了,进行工业数据集上的离在线实验,在多维度方针上对比现存的拍卖机制估量责任。

问题建模与表面分析

在线告白场景不错综合成一个典型的多坑拍卖问题。对于每条用户肯求,由个告白主(不错是手动转化出价或者自动出价代理)对    个告白位进行出价。告白主凭证自己的特有估值    提交出价   , 其中慑服价值漫衍  。给定出价向量 , 用户特征向量    以及扫数参竞告白的特征向量   ,平台的拍卖机制决定分拨决策    以及告白主的计费  ,其中    默示告白    分拨到告白位  。

告白拍卖中的外部性指的是竞胜告白主的效率会受到其它竞胜告白的影响 [ 1 ] 。对于 CPC 多坑拍卖,外部性影响主要反应在告白 CTR 上。咱们用    默示淘气感知排列外部性的 CTR 模子,告白    的 CTR 不错默示为  ,不错简化默示为  。

在上述排列外部性的拍卖机制建模下,告白主    的欲望效率为

拍卖机制的引发兼容(IC)条目要求信得过报价    最大化其欲望效率  ,个体感性(IR)条目则要求告白主效率非负。告白拍卖机制主见为最大化平台欲望收入且餍足 IC 和 IR 管制。

求解收入最大化机制的直不雅想法是除名经典的 Myerson 拍卖,咱们将排列外部性引入 Myerson 拍卖,不错写成如下样式,其中    默示经过 iron 操作后的杜撰价值函数(确保函数单调性):

分拨规矩:

 

计费规矩:

 

需要防范的是,由于排列外部性的引入,在最终分拨放弃中其它告白的影响下,告白主提进步价不一定会提高最终的 CTR,因此 Myerson 表面中的"单调分拨"性质在排列外部性影响下是否开垦需要再行论证。咱们表面解说了上述"单调分拨"的性质仍然保合手,具体表述为如下引理 1,无缺解说请参考论文原文附录 A.1。

引理 1: 在排列外部性建模下,若拍卖机制的分拨规矩最大化欲望杜撰福利,则对于淘气告白主以过火它告白主的出价向量,对于出价单调不减,或者称分拨规矩为单调的。

结合引理 1 和 Myerson 拍卖表面,不错解说上述引入排列外部性的 Myerson 拍卖为餍足 IC、IR 管制且最大化平台欲望收入的最优拍卖机制,无缺推导过程请参考论文原文 2.2 节。

径直求解上述最优分拨放弃需要成列参竞告白的扫数可能排列放弃,再进行选优,成列过程的筹谋复杂度为,线上场景下 ,,成列过程的高复杂度无法餍足线上推理实验要求。因此咱们计议将拍卖机制进行参数化,通过数据开动的时势进行学习。为了在端到端学习的过程中餍足 IC 管制并保合手优化过程的可微性,访佛多物品拍卖的估量责任 RegretNet [ 6 ] ,咱们将机制偏离 IC 条目的进度量化为每个告白主的 ex-post regret,即告白主通过虚报出价不错获取的最大效率加多值:

给订价值漫衍    中的    条采样,则告白主   的请示 ex-post regret 为

拍卖机制联想问题不错进一步改写成如下管制优化问题:

生成式拍卖

前文提到,现存的基于深度学习的拍卖机制受限于"先预估后分拨"的联想范式,无法感知排列级外部性。咱们建议的生成式拍卖引入了生成器 - 评估器的基本架构,模子合座架构如图 2 所示。生成器遴荐自转头模子,逐坑位感知依然决策完成的序列信息,生成告白序列。评估器捕捉告白序列中的商品相互影响,对精排阶段的单点 pCTR 结合序列险阻文信息进行校准,在考查时为生成器提供奖励信号。在线推理时,仅部署生成器,以保证线上推理时延。此外,咱们构建了 PaymentNet 模块,通过优化 ex-post regret 学习最优计费规矩。

△图 2:感知排列外部性的生成式拍卖合座框架 1、生成器

凭证表面推导的最优分拨样式,生成器的主见为凭证个参竞告白,生成长度为的告白序列,以最大化欲望杜撰福利。咱们构建的生成器包括两部分:餍足排列不变性(permutation-invariant)的联接编码器,以及餍足排列同变性(permutation-equivariant)的自转头解码器。排列不变性指的是更变模子输入元素的排列法例不会更变模子输出的放弃,排列同变性指的是输入元素的排列法例更变会引起输出放弃的排列法例产生换取的更变。前者保证输入模子的参竞告白法例不影响分拨放弃,后者在自动机制联想 [ 7-9 ] 的估量责任中过去诓骗, [ 10 ] 进一步论证了排列同变性不错普及机制的泛化性。

联接编码器旨在通过建模参竞联接粒度的外部性来增强每个告白的表征。编码器最初通过 self-attention layer 编码告白 embedding 序列:再经过 sum-pooling 层和 MLP 层得到联接粒度险阻文编码:

解码器使用自转头模子建模长度为的告白序列的合资概率漫衍:咱们使用 GRU 单位建模参竞告白在坑位的条目概率:,第个 GRU 单位迭代式地界说为:

其中为可学习的参数,恒久非负,确保更高的杜撰价值获取更大的分拨概率,与最大化杜撰福利的主见保合手一致。咱们接下来对在坑位之前分拨的告白进行 mask 操作,并基于概率进行采样以决策分拨到面前坑位的告白。叠加次采样过程,得到长度为的告白序列即为最终分拨放弃。防范到生成器中的 MLP 和 GRU 单位作用在每个 state-ad 对,且编码器餍足排列不变性,因此解码器餍足排列同变性。

2、评估器

评估器的主见为预估分拨放弃中每个告白的 CTR  ,进一步在考查过程中为生成器提供奖励信号。为了复用精排阶段从用户行动序列中索要的用户意思信息,幸免冗余建模,评估器在精排单点 pCTR 的基础上,预估排列外部性校准向量,再将二者进行逐元素相乘得到最终预估的 CTR:。模子结构上同期引入了双向 LSTM 和 self-attention 模块索要序列险阻文信息,最终将团聚用户 embedding 后的表征送入 MLP 层得到外部性校准向量:具体收场细节请参考论文原文。

3、计费模块

防范到第 2 节中表面推导的最优计费规矩包括积分项

通过蒙特卡洛采样近似筹谋积分时,每次采样皆需要调用生成器和评估器,在及时推理时的筹谋支出过大。在前文中,咱们将 IC 条目改写为每个告白主的请示 ex-post regret 便是 0,这使得咱们不错通过数据开动的时势构建计费模块学习上述最优计费规矩。计费模块输入包括告白分拨序列的表征,出价矩阵  ,以及欲望价值向量,其中默示生成器输出的告白分拨概率,默示评估器输出的外部性校准后的 CTR。为了餍足 IR 条目,计费模子通过 sigmoid 激活函数输出计费比,再与出价相乘得到最终计费。

4、考查历程

凭证第 2 节中推导的论断,最优分拨最大化杜撰福利,与计费规矩无关,因此咱们在考查时将基于生成器 - 评估器架构的分拨求解模块与计费模块的优化进行解耦。

咱们最初使用列表级的告白点击数据考查评估器,交叉熵失掉函数界说为:

其中    默示用户是否点击列表    中的第    个告白,默示评估器的外部性校准后的预估 CTR。

在评估器考查拘谨后,咱们冻结其参数,教授生成器考查。访佛推选系统重排责任 GRN [ 11 ] 的失掉函数联想想路,咱们将奖励函数拆解为两部分。Self-Reward 径直形容每个分拨的告白带来的杜撰福利增量,即 External-Reward 形容每个分拨的告白带来的外部性影响,即

访佛 VCG 拍卖中的边缘孝敬的想法。二者相加即可得到分拨告白的合座奖励函数:

其中默示摈斥告白后的告白序列。临了,咱们使用 Policy Gradient 界说生成器的失掉函数为:

在生成器 - 评估器架构考查拘谨后,咱们冻结其参数,使用增广拉格朗日模范求解第 2 节临了界说的管制优化问题以优化计费模块,对违背 IC 条目施加处理项,增广拉格朗日函数界说为:

计费模块的优化过程包括以下两个过程的迭代:

(1)更新计费模块的参数

(2)更新拉格朗日乘子

实验

咱们在淘宝展示告白场景的信得过数据集上以及线上环境中评估生成式拍卖的灵验性。对比的基线模范按照外部性建模的粒度不错分为三类:

无外部性建模:GSP 广义二价拍卖。

联接粒度外部性建模:DNA [ 2 ] ;SW-VCG [ 3 ] 。

排列级外部性建模:基于成列收场的 VCG 拍卖;EdgeNet [ 12 ] ;表面推导的最优拍卖机制。

1、离线实验

离线实验使用的考查集和测试集离别包括不同日历随即采样的 50 万条和 10 万条拍卖日记,每次拍卖约有 30 个告白参竞。咱们计议告白主出价的条目漫衍离别慑服均匀漫衍(uniform)和指数漫衍(exponential),在两种条目下离别进行评估。评估方针包括平台收入方针 RPM(Revenue Per Mille),CTR 以及评估机制 IC 条目的方针

量度告白主通过非信得过出价大约获取的效率相对增量。

实验放弃如表 1 所示。不错不雅察到跟着外部性建模从不计议外部性到联接粒度外部性,再到排列级外部性,三个方针均趋向更优。此外,防范到与基于成列法收场的表面最优上界比较,生成式拍卖(CGA)达到了 95% 的平台收入以及极低的值,标明生成式拍卖不错高效近似表面最优机制。

△表 1:离线对比实验。方针后的百分比增减量默示基线模范比较 CGA 的相对值 2、在线实验

咱们在展示告白场景进行了线上 A/B 实验,基线为线上使用的 DNA [ 2 ] 机制。实验放弃标明,生成式拍卖在推理时延仅加多 1.6% 的情况下,平台收入方针 RPM 提高了 3.2%,CTR 普及 1.4%,成交 GMV 普及 6.4%,告白主 ROI 普及 3.5%。实验放弃标明生成式拍卖带来的收入普及不是由于径直举高告白主计费,而是通过感知排列级外部性优化告白分拨,收场更精确的告白触达,反应于 CTR、GMV 以及告白主 ROI 的普及。

总结

本文从告白拍卖机制中的排列级外部性影响起程,恣虐"先预估后分拨"的联想范式,针对在线告白场景建议了感知排列外部性的生成式拍卖。放弃标明,经典的 Myerson 拍卖在移动到排列级外部性的样式后,仍然保合手其最优性。

基于这一论断,团队联想的生成式拍卖架构将分拨和计费模块解耦。在具体收场上,构建了基于生成器 - 评估器的自转头生成式结构来优化分拨,并将 IC 管制量化为最小化欲望过后后悔来学习最优支付规矩。工业级场景的离在线实验考据了生成式拍卖的灵验性。值得防范的是,建议的生成式拍卖框架并不局限于特定的生成式模子。

将来的估量责任将探索引入愈加高效的生成式架构,并在拍卖机制中和洽分拨来自多渠说念的商品,举例当然放弃与告白的交融混排。

对于团队

阿里姆妈展示告白机制战略算法团队,勤勉于遏抑优化阿里展示告白期间体系,开动业务增长,股东期间合手续革命;遏抑升级工程架构以支合手阿里姆妈展示告白业务谨慎 & 高效迭代,深挖生意化价值并优化告白主投放成果,孵化革命产物和革命生意化模式,优化告白生态健壮性;开动机制升级,并已迈入 Deep Learning for Mechanisms 时间,团队革命责任发表于 KDD、WWW、ICML、CIKM、WSDM、AAMAS、AAAI 等鸿沟闻明会议。在此诚恳接待有 ML 布景的同学加入!

alimama_tech@service.alibaba.com

参考文件

[ 1 ] Arpita Ghosh and Mohammad Mahdian. Externalities in online advertising. WWW ’ 08.

[ 2 ] Xiangyu Liu, Chuan Yu, Zhilin Zhang, Zhenzhe Zheng, Yu Rong, Hongtao Lv, Da Huo, Yiqing Wang, Dagui Chen, Jian Xu, Fan Wu, Guihai Chen, and Xiaoqiang Zhu. Neural auction: End-to-end learning of auction mechanisms for e-commerce advertising. KDD ’ 21.

[ 3 ] Ningyuan Li, Yunxuan Ma, Yang Zhao, Zhijian Duan, Yurong Chen, Zhilin Zhang, Jian Xu, Bo Zheng, and Xiaotie Deng. Learning-Based Ad Auction Design with Externalities: The Framework and A Matching-Based Approach. KDD ’ 23.

[ 4 ] Guogang Liao, Xuejian Li, Ze Wang, Fan Yang, Muzhi Guan, Bingqi Zhu, Yongkang Wang, Xingxing Wang, and Dong Wang. 2022. NMA: Neural Multi-slot Auctions with Externalities for Online Advertising. arXiv preprint arXiv:2205.10018 ( 2022 ) .

[ 5 ] Roger B Myerson. 1981. Optimal auction design. Mathematics of operations research 6, 1 ( 1981 ) , 58 – 73.

[ 6 ] Paul D ü tting, Zhe Feng, Harikrishna Narasimhan, David Parkes, and Sai Srivatsa Ravindranath. Optimal auctions through deep learning. ICML ’ 19.

[ 7 ] Zhijian Duan, Haoran Sun, Yurong Chen, and Xiaotie Deng. A scalable neural network for dsic affine maximizer auction design. NeurIPS ’ 24.

[ 8 ] Dmitry Ivanov, Iskander Safiulin, Igor Filippov, and Ksenia Balabaeva. Optimal-er auctions through attention. NeurIPS ’ 22.

[ 9 ] Jad Rahme, Samy Jelassi, Joan Bruna, and S Matthew Weinberg. A permutation-equivariant neural network architecture for auction design. AAAI ’ 21.

[ 10 ] Tian Qin, Fengxiang He, Dingfeng Shi, Wenbing Huang, and Dacheng Tao. Benefits of permutation-equivariance in auction mechanisms. NeurIPS ’ 22.

[ 11 ] Yufei Feng, Binbin Hu, Yu Gong, Fei Sun, Qingwen Liu, and Wenwu Ou. 2021. GRN: Generative Rerank Network for Context-wise Recommendation. arXiv preprint arXiv:2104.00860 ( 2021 ) .

[ 12 ] Guangyuan Shen, Shengjie Sun, Dehong Gao, Duanxiao Song, Libin Yang, Zhen Wang, Yongping Shi, and Wei Ning. EdgeNet: Encoder-decoder generative Network for Auction Design in E-commerce Online Advertising. CIKM ’ 23.

* 本文系量子位获授权刊载,不雅点仅为作家扫数。

黄色幽默

—  完  —

量子位  QbitAI

վ ' ᴗ ' ի 跟踪 AI 期间和产物新动态

一键三连「共享」、「点赞」和「在看」

科技前沿阐明日日再见 ~  



>> 蕾丝 百合 调教 菲仕兰大师CEO范晏德:中国一直是菲仕兰的艰难商场..

>> bt核工厂地址 超等混动理智旗舰SUV红旗HS7 PHEV滂湃上市..

>> bt核工厂地址 德国无邪车交易中央协会:对中国电动汽车加税将扼制耗尽..

>> bt核工厂地址 今作念他城客,才觉月多情..

>> bt核工厂地址 海量财经丨2024年国庆档电影票房达21.04亿元,九..

>> suzyq 足交 10月14日低硫燃油期货收盘下落1.32%,报419..

>> bt核工厂地址 创业板指跌幅扩大至2% 全市集超4100只个股飘绿..

>> bt核工厂地址 【12315投诉公示】珀莱雅新增2件投诉公示,涉过火他..

>> hongkongdoll 最新 民间故事: 北岳大帝..

>> 小宝 探花 这个东北下岗潮故事,就为那击穿迷失的刹那间..