学习强国

微信

山大发布

抖音

视频号

微博

小红书

快手

哔哩哔哩

山东大学报

学术纵横

人工智能学院2项最新研究成果被国际顶级会议-国际万维网大会录用

发布:山东大学融媒体中心 日期:2026年04月04日 点击数:

[本站讯]近日,山东大学人工智能学院通用智能实验室(GAI Lab, General Artificial Intelligence Lab)在交叉/综合/新兴领域的国际顶级会议国际万维网大会(The ACM Web Conference,WWW 2026)上同时录用2篇长文论文。本届大会收到了3370份有效投稿,其中676篇(20.1%)被会议接受。充分显示了山东大学人工智能学院在Web搜索与挖掘、信息检索等人工智能领域的创新能力与国际学术影响力。

成果一:MCoT-MVS: Multi-level Vision Selection by Multi-modal Chain-of-Thought Reasoning for Composed Image Retrieval 。

图1:与主流组合图像检索方法对比,MCoT-MVS(A)的方法流程

组合图像检索(Composed Image Retrieval, CIR)旨在根据参考图像和修改文本检索目标图像,在电商个性化推荐、交互式搜索引擎等真实场景中具有广泛应用 。然而,现有方法在处理复杂的文本修改逻辑时,往往难以从参考图像中精准提取符合用户意图的语义线索,导致无关的视觉噪声严重干扰检索精度 。针对上述挑战,论文提出了基于多模态思维链推理的多层级视觉选择框架(MCoT-MVS)。该框架首先利用多模态大语言模型对组合意图进行显式的思维链推理,生成结构化的语义线索(包括保留、删除及目标推断文本);随后,设计了补丁级(Patch-level)与实例级(Instance-level)视觉选择模块,在MLLM推理结果的引导下,从参考图像中精准锚定判别性的局部语义并剔除背景干扰 ;最后,通过加权层次化组合模块,实现组合查询与目标图像在统一嵌入空间中的深度对齐 。论文在CIRR(真实世界复杂场景)和FashionIQ(服饰专业领域)两个标准基准数据集上进行了详尽实验 。系统验证了MCoT-MVS在两项任务中均刷新了当前的最优性能(SOTA),充分证明了其在处理精细化语义演化与复杂意图理解方面的显著优势

山东大学人工智能学院通用智能实验室葛旭日助理教授为该论文第一作者,学生汪椿昊为共同第一作者,通讯作者为人工智能学院辛鑫副教授,山东大学为第一单位。

成果二:R2NS: Recall and Re-ranking of Negative Samples for Sequential Recommendation

图2:R2NS负采样过程

负采样在序列推荐系统中扮演着至关重要的角色,它通过提供对比信号,帮助模型精准区分用户的偏好与非偏好物品。然而,现有的主流负采样方法通常直接从随机物品子集中抽取得分最高的“困难负样本”。这种做法面临着三大痛点:一是过早引入高难度样本易导致早期训练崩溃;二是仅针对小规模子集打分导致缺乏全局视野;三是固定的排名策略无法精细控制模型的学习难度。为攻克上述挑战,研究团队创新提出面向序列推荐的负样本“召回-重排”机制(R2NS)。该方法模拟循序渐进的学习过程,主要通过三个核心阶段来实现:首先在“预热启动”阶段,采用基础的均匀负采样稳固模型能力,避免因过早引入困难样本而导致训练失效;随后在“全局召回”阶段,利用高效的最大索引近似方法突破局部限制,直接从全量物品中筛选候选负样本,为模型引入全局维度的对比信号;最后进入“课程重排”阶段,引入基于课程学习的排名策略,随着训练的推进,动态且精细地调节负样本的学习难度。

实验结果表明: R2NS 负采样机制在 Beauty、Sports、Toys 和 Yelp 等真实世界数据集上取得显著提升 ,相比现有的前沿动态负采样方法(如 DNS+)实现最高达 21.8% 的性能提升;相较于多种代表性的负采样基线方法,在各项核心推荐指标上均实现超过 10% 的稳健增长 ,并在 5 种不同的序列推荐模型(包含主流的 SASRec 与最新的 Mamba4Rec 等)及 2 种常见的损失函数(BCE 与 BPR)下均保持一致的性能增益 ,体现了在卓越有效性与强大泛化能力上的双重优势。

实验室2021级本科生李元孜为该论文第一作者,导师为辛鑫副教授,协助指导老师为葛旭日助理教授,山东大学为第一单位。

国际万维网大会(The Web Conference,亦称 WWW)是Web领域最具影响力的国际顶级学术会议之一。该会议系列始于1994年,至2026年已成功举办35届。会议聚焦万维网及其相关技术的前沿研究与应用,涵盖Web搜索与挖掘、信息检索、推荐系统、社交网络、知识图谱、Web安全与隐私、人机交互以及AI与Web的交叉方向等多个重要研究领域,是全球学术界与工业界研究人员展示创新成果、交流前沿思想和探讨Web未来发展的重要国际平台。在学术评价体系中,WWW被中国计算机学会(CCF)推荐为A类国际学术会议(交叉/综合/新兴领域)。


【供稿单位:人工智能学院     作者:葛旭日    责任编辑:刘怡康 朱若佟】