山东大学新闻网
山大邮箱 | 投稿系统 | 高级检索 | 旧版回顾

视点首页 > 学术纵横 > 正文

计算机学院在国际信息检索与数据挖掘顶级会议WSDM获奖

发布日期:2024年03月13日 09:13 点击次数:

[本站讯]3月4日-8日,国际信息检索与数据挖掘领域顶级会议WSDM (The 17th ACM International Conference on Web Search and Data Mining)在墨西哥召开,山东大学计算机科学与技术学院信息检索实验室的研究成果“Debiasing Sequential Recommenders through Distributionally Robust Optimization over System Exposure”获得了本次会议的最佳论文提名奖。论文的第一作者是计算机学院硕士研究生杨纪元,通讯作者是计算机学院助理教授辛鑫,合作者包括学院教授马军、陈竹敏、任昭春和研究员任鹏杰,山东大学为第一作者和通讯作者单位。这是该团队在近期获得国际顶级会议EMNLP 2023杰出论文奖之后的又一突出工作。

WSDM是中国计算机学会排名B类、清华计算机类会议排名A类的国际顶级学术会议,在互联网搜索、数据挖掘领域享有很高的声誉。本次会议共收到615 篇投稿,112篇被录用,录用率约18%,其中有3篇论文获得最佳论文/提名奖,来自谷歌的研究团队获得最佳论文奖,来自密歇根州立大学、微软和卡内基梅隆大学的研究团队获得另一篇最佳论文提名奖。

本篇获奖论文研究了序列推荐系统中的曝光偏差问题。序列推荐模型通常经过用户-物品的交互进行训练,这种交互会受到系统曝光偏差的影响,导致从有偏的序列推荐模型中学习到的用户偏好与真实的用户偏好并不完全一致。现有的去偏方法并未充分利用系统曝光数据,存在推荐性能次优而且存在方差大的问题。本文提出了一种通过对系统曝光数据进行分布鲁棒优化(DRO)的方法对序列推荐模型进行去偏,关键思路是利用DRO优化不确定集上的最坏误差,以保护模型免受曝光偏差引起的分布差异。该方法的主要挑战在于如何构建不确定集并避免对有偏样本用户的偏好进行过度估计。此外,由于测试集也可能受到曝光偏差的影响,如何评估模型的去偏差效果也是一个悬而未决的问题。为此,本文首先引入一个在系统曝光数据上训练的曝光模拟器来计算曝光分布,然后将其视为名义分布(nominal distribution)来构造DRO的不确定集。然后,本文对那些具有高曝光几率的物品引入惩罚,以避免对有偏样本用户偏好的过度估计。最后,本文设计了一个去偏的自归一化反倾向性评分(SNIPS)评估器,用于评估有偏离线测试集上的去偏效果。本文在两个真实世界的数据集上进行了大量实验,实验结果表明本文提出的方法取得了优越的性能。


【供稿单位:计算机学院    作者:辛鑫    编辑:新闻网工作室    责任编辑:蒋晓涵 梁宇欣  】

 匿名发布 验证码 看不清楚,换张图片
0条评论    共1页   当前第1拖动光标可翻页查看更多评论

免责声明

您是本站的第: 位访客

新闻中心电话:0531-88362831 0531-88369009 联系信箱:xwzx@sdu.edu.cn

建议使用IE8.0以上浏览器和1366*768分辨率浏览本站以取得最佳浏览效果

欢迎关注山大视点微信