KDD 2023 | 美团技术团队精选论文解读

news2025/9/16 5:31:21

本文精选了美团技术团队被KDD 2023收录的7篇论文进行解读,论文覆盖了Feed流推荐、多模态数据、实例分割、用户意图预测等多个方向。这些论文也是美团技术团队与国内多所高校、科研机构合作的成果。希望给从事相关研究工作的同学带来一些启发或者帮助。

045dbd5429b982a51c659c04d121c959.png

ACM SIGKDD(国际数据挖掘与知识发现大会,简称KDD)于1995年首次举办,自此成为数据挖掘领域的重要国际会议之一,也是研究数据挖掘和知识发现这一领域的学者和企业人士分享研究成果、讨论前沿话题、推动技术进步和发展的重要平台。ACM SIGKDD的宗旨是促进数据挖掘的应用和理论研究,支持和推动先进技术和方法的开发和创新,并推广数据挖掘和知识发现领域的教育、培训和普及。该组织致力于提高数据挖掘和知识发现的社会价值,推动其在各个领域的应用和发展。

01《PIER: Permutation-Level Interest-Based End-to-End Re-ranking Framework in E-commerce》

论文作者:晓文、杨凡(共同一作)、王泽、晓旭、国钢、永康、兴星、王栋等,均来自美团技术团队。

论文类型:长文

论文下载:PDF

189cc4ccc310b8c585ecc228e73b6cea.png

论文简介:Feed流推荐作为目前最主流的推荐载体,其推荐质量直接影响用户体验/商家效益/平台收入等多个核心指标。Feed推荐特点是为每个用户的请求生成并展示多个items,用户的点击行为会同时受到上文和下文影响。由于传统point-CTR预测是在展现items产生之前进行的,导致无法利用上下文信息,推荐质量受损。目前工业届更多考虑重排方案,然而由于排列的多样性,穷举会导致排列个数过多,实际很难落地。目前业界通常存在两种近似方案:

  1. 只考虑位置偏置和上文信息,但忽略下文影响效果;

  2. 同时考虑上下文,Listwise预估后重新排序,该方案存在Evaluation Before Reranking的问题。

以上两个方案在效果上均有损,因此如何在重排阶段同时考虑上下文,并且降低复杂度兼顾可落地性,是一个非常重要的问题。针对以上问题,论文提出了一个名为PIER的端到端重新排序框架,该框架遵循两阶段范式并包含两个主要模块,分别称为FPSM 和OCPM。

基于用户页面兴趣偏好,在FPSM中应用SimHash从全排列中快速的生成候选列表集合,降低了落地复杂度;然后在OCPM中设计了一种新颖的全向注意力建模机制,以更好地捕获列表中的上下文信息;最后,通过引入对比学习损失以端到端的方式联合训练这两个模块,使用OCPM的预测值来指导FPSM生成更好的列表。离线实验结果表明,PIER在公开和工业数据集上均优于基线模型,目前已经部署到美团外卖广告场景,取得了较为显著的成果。

02《A Collaborative Transfer Learning Framework for Cross-domain Recommendation》

论文作者:张伟、鹏业、张波、兴星、王栋等,均来自美团技术团队。

论文类型:长文

论文下载:PDF

7df0c3592c303c1be7c310c992ab9634.png

论文简介:在推荐系统中,为了满足用户多样化的兴趣和需求,催生出多种业务领域(Domain)。每个领域的点击率(CTR)可能会有较大差别,这导致了对不同业务领域的CTR预测建模需求。为了提升目标域效果,越来越多的学者尝试综合利用多域数据改善模型表现,也被称为知识迁移。这其中主要有2种迁移学习的范式:1)预训练+微调:源域的最优解对于目标域可能是局部最优,导致负迁移(Negative Transfer);2)混合样本+多任务训练:不同域之间数量和特征存在差异,梯度容易被数据量大的域主导(Seesaw Effect)。

针对以上问题,该论文提出了一种协同跨域迁移学习框架(简称CCTL)来解决这些问题,通过协同训练的方式,评估源域样本对目标域的信息增益,以此作为反馈计算源域样本权重,从而使目标域获得更多有益的迁移知识。框架整体上分为两个模块:IFN模块用于输出源域样本表征及权重,SCN模块用于主模型训练及源域增益计算及反馈。同时,通过REN模块使用对比学习强化不同域的差异性信息,使用SAN模块对齐源域目标域在多个Token的表征。CCTL被部署在美团外卖展示广告场景,并取得较为明显的收益。

03《Modeling Dual Period-Varying Preferences for Takeaway Recommendation》

论文作者:玉婷(美团)、吴贻清(中国科学院计算技术研究所)、朱勇椿(中国科学院计算技术研究所)、庄福振(北京航空航天大学)、瑞东(美团)、北海(美团)、展博(美团)、安竹林(中国科学院计算技术研究所)、徐勇军(中国科学院计算技术研究所)

论文类型:长文

论文地址:PDF

68a2e506131a3856b42433ceb84443b6.png

论文简介:外卖推荐系统旨在为用户提供含有符合用户兴趣偏好的菜品的商家,已经服务于数十亿用户。与传统推荐不同,外卖推荐面临两大挑战:

  1. 双重交互感知偏好。传统推荐往往关注单一层次的用户对商品的偏好,而外卖推荐则需要综合考虑用户对商家和菜品的双重偏好。

  2. 一天内的用户偏好变化。传统的推荐通常从会话级别或天级别的角度对用户偏好的连续变化进行建模。然而,在实际的外卖系统中,一天中的早、中、晚、深夜时段,用户的偏好差异显著。

为了应对这些挑战,该论文提出了一种针对于外卖推荐场景的双重时段变化偏好建模模型(DPVP)。具体而言,论文设计了双重交互感知(Dual Interaction-Aware) 模块,旨在根据用户与商店和食品的交互来捕捉用户的双重偏好。此外,为了模拟用户一天中不同时段变化的偏好,论文提出了基于时间的分解(Time-based Decomposition) 模块以及时间感知门控机制(Time-Aware Gate)。离线和在线实验均表明,论文模型在现实世界的数据集上优于最先进的方法,并且能够捕捉用户的双重时段变化的偏好。此外,该模型已经在美团外卖平台上线,取得了较为明显的成绩。

04 《A Multi-stage Framework for Online Bonus Allocation Based on Constrained User Intent Detection》

论文作者:王超、晓巍、徐帅、王哲、志强、冯岩、游安、陈彧等,均来自美团技术团队。

论文类型:长文

论文地址:PDF

f20b22f06d6f2edb5570d920cc720a3f.png

论文简介:奖励分配是营销领域的一个重要问题,通常可以建模为一个背包优化问题,主流的解决方案通常是两阶段的方法。第一阶段是用户意图检测,预测用户在每个奖励下的转化概率。在第二阶段求解运筹优化问题,得到最优分配策略。然而,该解决方案通常面临以下挑战:

  1. 在用户意图检测阶段,由于交互和噪声的稀疏性,传统的uplift估计方法缺乏可解释性,常出现违背边际效用为正的领域知识;

  2. 两个阶段之间存在最优性差距,限制了第二阶段所获得最优值的上界;

  3. 由于线上环境的变化,实际奖励成本消耗经常违反给定的预算限额。

为了解决上述挑战,论文提出了一个由三个模块组成的框架,即用户意图检测模块、在线分配模块和反馈控制模块。对于第一个挑战,在用户意图检测模块中,论文基于深度表示学习对效用增量进行隐式建模,提出单调约束结构增强模型解释性。为了减小两阶段最优性差距,进一步提出了凸约束模型来提高最优值的上限,以解决第二个挑战。针对第三个挑战,为了应对在线成本消耗地波动,论文利用框架中的反馈控制策略,使实际成本更准确地接近给定的预算限制。基于真实的美团支付数据评估以及线上A/B实验均证明了该方案的优势和有效性。

05《C-AOI: Contour-based Instance Segmentation for High-Quality Areas-of-Interest in Online Food Delivery Platform》

论文作者:奕达、丽影、大平、水平、方潇、井华、仁清、致钊等,均来自美团技术团队。

论文类型:长文

论文下载:PDF

22e3cde3fa758b5c4af6a9bf6e725446.png

论文简介:AOI是配送业务数字化运营的基础设施,也是关键决策算法的基础单元。现有的AOI自动生成相关研究主要依赖于三种方式:1)预定义的形状;2)基于密度的聚类;3)需要多个模型进行后处理的语义分割方法。上述研究方法降低了AOI轮廓的生成质量上限从而限制了自动生成AOI轮廓的落地。

为了解决上述问题,该论文将其构建为基于实例分割的轮廓回归问题并提出了一种端到端的AOI轮廓自动生成框架C-AOI。在C-AOI中,提出了Contour Transformer、循环位置编码以及自适应匹配损失优化顶点回归路径。该模型在美团配送业务数据集上进行了实验,大幅提升AOI边界生成质量的同时具备较快的推理速度。此外,该模型已投产并应用于美团履约场景。

06 《NEON: Living Needs Prediction System in Meituan》

论文作者:兰孝翀(清华大学)、高宸(清华大学)、诗琪(美团)、秀琦(美团)、影格(美团)、张晗(美团)、华周(美团)、恒亮(美团)、李勇(清华大学)

论文类型:长文

论文地址:PDF

4f497db2445ac741a89c85b7cac46cb4.png

论文简介:用户意图包含人们日常生活中的各类需求,如吃、住、娱乐等。美团作为连接用户和服务提供者的生活服务平台,用户意图预测问题往往被定义为预测用户当前的业务需求。准确理解用户意图对于生活服务平台而言至关重要,理解结果能够广泛应用于平台推荐系统、精准化营销等多种业务场景。然而,当前平台在用户意图预测问题上的探索并不是很多,且面临如下两个严峻挑战:

  1. 用户需求,经常受人物、地点、时间、自然环境等多种复杂因素的影响;

  2. 用户意图存在多样化特点,并非用户的所有需求都会在美团App上体现。

为了应对上述两个挑战,本论文设计了一个名为NEON的用户意图预测系统,其主要包括三个阶段:特征挖掘、特征融合和多任务预测。

  1. 在特征挖掘阶段,基于时、空、人、环境等维度进行用户消费场景定义,并重点提取了不同场景下的群体行为特征用于建模,通过人群共性行为辅助进行系统冷启优化,有效缓解了数据稀疏问题。

  2. 在特征融合阶段,构造了融合用户个体及所属群体行为特征的网络结构,该网络可以有效学习不同场景下的用户意图变化。

  3. 在多任务预测阶段,除了预测用户业务意图之外,引入辅助任务,用来预测用户履约方式偏好(送货到家、到店消费),以此来增强模型对时、空上下文的学习。

论文中的NEON系统,已部署至美团的推荐、营销、运营算法引擎中,大规模在线A/B测试评估实验表明,NEON在上述多个应用场景下均可带来业务效果的显著提升,实验结果证明了NEON系统在细粒度用户需求刻画、履约方式偏好识别、潜在需求预测等方面的有效性。

07 《A Hybrid Approach of Statistics and Embeddings for Multilingual and Multi-Locale Recommendation》

论文作者:伟佳(美团)、詹金(DataRobot) 、黄钟山(Freelance)、王露(微软)、王强(美团)

论文类型:Workshop

论文下载:PDF

902027b28afebf857b001c95ce58ac1e.png

论文简介:为了鼓励多语言推荐系统的发展,亚马逊发布了一个多语言和多地区购物会话数据集,并基于该数据集举办了KDD Cup 2023多语言多地区会话推荐挑战赛。本论文介绍了美团在此次比赛中的解决方案。按照推荐系统中广泛使用的设定,美团的解决方案包括两个阶段:召回和排序。在第一阶段,利用各种召回策略检索一组候选Item,包括基于共同访问矩阵的I2I召回、基于GraphEmbedding的I2I召回、基于TextTransformer的I2I搜索和基于BPR的U2I召回。在第二阶段,训练了一个模型来预测每个用户与候选产品互动的概率。该模型是两个GBDT模型的集成,包括丰富的统计特征和Embedding相似度特征。该团队在在Track2中获得了第3名,在Track1中获得了第4名。

----------  END  ----------

 活动推荐 

d25ff0b031e47b395907636a4c2e0c0a.jpeg

随着《无人驾驶航空器飞行管理暂行条例》出台,低空经济在法律层面上有了明确的定义。美团作为城市低空物流的先行者,从2017年就开始探索无人机配送能力。2021年1月,我们实现第一单面向真实用户的无人机配送。至今为止已经完成超过17万单无人机配送。

美团于2023年7月5日在上海发布了第四代城市物流无人机,其多天候、高安全、低噪音等特点助力美团无人机配送开拓更多场景。本期沙龙将介绍城市低空物流无人机背后的设计挑战与应对。

8月19日(周六)下午,深圳线下+线上直播,美团技术专家们将分享以下6个议题,欢迎报名👏🏻

700aba4bc4460a9eac0baf10eacba4ec.jpeg

 美团科研合作 

美团科研合作致力于搭建美团技术团队与高校、科研机构、智库的合作桥梁和平台,依托美团丰富的业务场景、数据资源和真实的产业问题,开放创新,汇聚向上的力量,围绕机器人、人工智能、大数据、物联网、无人驾驶、运筹优化等领域,共同探索前沿科技和产业焦点宏观问题,促进产学研合作交流和成果转化,推动优秀人才培养。面向未来,我们期待能与更多高校和科研院所的老师和同学们进行合作。欢迎老师和同学们发送邮件至:meituan.oi@meituan.com。

 推荐阅读 

  | KDD 2022 | 美团技术团队精选论文解读

  | KDD Cup 2020多模态召回比赛亚军方案与搜索业务应用

  | 7次KDD Cup&Kaggle冠军的经验分享:从多领域优化到AutoML框架

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/862048.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

(el-switch)操作(不使用 ts):Element-plus 中 Switch 将默认值修改为 “true“ 与 “false“(字符串)来控制开关

Ⅰ、Element-plus 提供的 Switch 开关组件与想要目标情况的对比: 1、Element-plus 提供 Switch 组件情况: 其一、Element-ui 自提供的 Switch 代码情况为(示例的代码): // Element-plus 自提供的代码: // 此时是使用了 ts 语言环…

如何理解MySQL隔离性---3个记录隐藏字段、undo日志、Read View

目录 一、3个记录隐藏字段 二、undo 日志 三、read view 一、3个记录隐藏字段 本片文章是帮助理解上篇文章Mysql隔离性的辅助知识。 mysql在建表时,不仅仅创建了表的结构,还创建了3个隐藏字段。 DB_TRX_ID :6 byte,最近修改( 修…

uniapp-原生地图截屏返回base64-进行画板编辑功能

一、场景 vue写uniapp打包安卓包,实现原生地图截屏(andirod同事做的)-画板编辑功能 实现效果: 二、逻辑步骤简略 1. 由 原生地图nvue部分,回调返回 地图截屏生成的base64 数据, 2. 通过 uni插件市场 im…

Go异常处理机制panic和recover

recover 使用panic抛出异常后, 将立即停止当前函数的执行并运行所有被defer的函数,然后将panic抛向上一层,直至程序crash。但是也可以使用被defer的recover函数来捕获异常阻止程序的崩溃,recover只有被defer后才是有意义的。 func main() { p…

如何让ES低成本、高性能?滴滴落地ZSTD压缩算法的实践分享

前文分别介绍了滴滴自研的ES强一致性多活是如何实现的、以及如何提升ES的性能潜力。由于滴滴ES日志场景每天写入量在5PB-10PB量级,写入压力和业务成本压力大,为了提升ES的写入性能,我们让ES支持ZSTD压缩算法,本篇文章详细展开滴滴…

Ceph集群安装部署

Ceph集群安装部署 目录 Ceph集群安装部署 1、环境准备 1.1 环境简介1.2 配置hosts解析(所有节点)1.3 配置时间同步2、安装docker(所有节点)3、配置镜像 3.1 下载ceph镜像(所有节点执行)3.2 搭建制作本地仓库(ceph-01节点执行)3.3 配置私有仓库(所有节点执行)3.4 为 Docker 镜像…

C语言可变数组 嵌套的可变数组,翻过了山跨过了河 又掉进了坑

可变数组 ​专栏内容: postgresql内核源码分析 手写数据库toadb 并发编程 个人主页:我的主页 座右铭:天行健,君子以自强不息;地势坤,君子以厚德载物. 概述 数组中元素是顺序存放,这一特性让我们…

Java获取路径时Class.getResource()和ClassLoader.getResource()区别

Java中取资源时,经常用到Class.getResource()和ClassLoader.getResource(),Class.getResourceAsStream()和ClassLoader().getResourceAsStream(),这里来看看他们在取资源文件时候的路径有什么区别的问题。 环境信息: 系统&#…

css3瀑布流布局遇见截断下一列展示后半截现象

css3 瀑布流布局遇见截断下一列展示后半截现象 注:css3实现瀑布流布局简直不要太香~~~~~ 场景-在uniapp项目中 当瀑布流布局column-grap:10px 相邻两列之间的间隙为10px,column-count:2,2列展示…

基于k8s的devOps自动化运维平台架构设计(中英文版本)

▲ 点击上方"DevOps和k8s全栈技术"关注公众号 In the rapidly evolving landscape of software development and IT operations, DevOps has emerged as a transformative approach to bridge the gap between development and operations teams. One of the key ena…

第五期(2022-2023)传统行业云原生技术落地调研报告——央国企篇

随着国务院国资委印发《关于加快推进国有企业数字化转型工作的通知》,开启了国有企业数字化转型的新篇章。大型央、 国企纷纷顺应趋势,加速云化布局,将数字化转型工作定位为“十四五”时期重点任务。同时,越来越多的企业通过云原生…

【Leetcode】155. 最小栈、JZ31 栈的压入、弹出序列

作者:小卢 专栏:《Leetcode》 喜欢的话:世间因为少年的挺身而出,而更加瑰丽。 ——《人民日报》 155. 最小栈 155. 最小栈 题目描述; 设计一个支持 push ,pop ,top …

C语言笔记7

#include <stdio.h> int main(void) {int a123;int b052;//十进制42int c0xa2;//十进制162printf("a%d b%o c%x \n",a,b,c);//分别是十进制 八进制 十六进制printf("a%d b%d c%d \n",a,b,c);printf("Hello 凌迟老头\n");return …

uniapp 使用canvas画海报(微信小程序)

效果展示&#xff1a; 项目要求&#xff1a;点击分享绘制海报&#xff0c;并实现分享到好友&#xff0c;朋友圈&#xff0c;并保存 先实现绘制海报 <view class"data_item" v-for"(item,index) in dataList" :key"index"click"goDet…

并发——线程池,Executor 框架

文章目录 1 简介2 Executor 框架结构(主要由三大部分组成)1) 任务(Runnable /Callable)2) 任务的执行(Executor)3) 异步计算的结果(Future) 3 Executor 框架的使用示意图 1 简介 Executor 框架是 Java5 之后引进的&#xff0c;在 Java 5 之后&#xff0c;通过 Executor 来启动…

vue+springboot基于web的火车高铁铁路订票管理系统

铁路订票管理系统按照权限的类型进行划分&#xff0c;分为用户和管理员两个模块。管理员模块主要针对整个系统的管理进行设计&#xff0c;提高了管理的效率和标准。主要功能包括个人中心、用户管理、火车类型管理、火车信息管理、车票预订管理、车票退票管理、系统管理等&#…

解决遥感技术在生态、能源、大气等领域的碳排放监测及模拟问题

以全球变暖为主要特征的气候变化已成为全球性环境问题&#xff0c;对全球可持续发展带来严峻挑战。2015年多国在《巴黎协定》上明确提出缔约方应尽快实现碳达峰和碳中和目标。2019年第49届 IPCC全会明确增加了基于卫星遥感的排放清单校验方法。随着碳中和目标以及全球碳盘点的现…

单源最短路

无负环 Dijkstra 迪杰斯特拉算法 采用的贪心的策略 每次遍历到始点距离最近且未访问过的顶点的邻接节点&#xff0c;直到扩展到终点为止 Dijkstra求最短路 I 给定一个 n 个点 m 条边的有向图&#xff0c;图中可能存在重边和自环&#xff0c;所有边权均为正值。 请你求出 1 …

微服务 云原生:基于 Gogs + Drone 实现 CI/CD 自动化

一般构建部署 以一个简单的前后端项目来说&#xff0c;分别编写前后端的 Dockerfile 文件并构建镜像&#xff0c;然后编写 docker-compose.yml 构建部署&#xff0c;启动运行。每次代码变更后都需重新手动打包、构建、推送。 一个简单的例子&#xff1a; 前端&#xff1a; 项…

解读HTML-入门第一文

HTML详细解读 概念解读基本结构常用标签标题标签&#xff08;h1~h6&#xff09;段落标签&#xff08;p&#xff09;链接标签&#xff08;a&#xff09;图像标签&#xff08;img&#xff09;列表标签&#xff08;ul、ol、li&#xff09;表格标签&#xff08;table、tr、td&#…