山东大学新闻网
山大邮箱 | 投稿系统 | 高级检索 | 旧版回顾

视点首页 > 学术纵横 > 正文

人工智能学院通用智能团队成果获国际顶级会议ICML2025录用

发布日期:2025年05月12日 11:10 点击次数:

[本站讯]近日,山东大学浪潮人工智能学院通用智能团队提交的研究论文“Reidentify: Context-Aware Identity Generation for Contextual Multi-Agent Reinforcement Learning”被人工智能领域顶级国际会议International Conference on Machine Learning(ICML 2025)正式录用。山东大学浪潮人工智能学院助理教授徐志伟为论文第一作者,论文的第一作者及第一单位均为山东大学。

学界与业界普遍认为,智能体是人工智能领域的焦点、热点。该论文正是聚焦于多智能体强化学习(Multi-Agent Reinforcement Learning, MARL),重点研究其在上下文动态变化环境下的泛化能力挑战,首次提出Context-Aware Identity Generation(CAID)框架,用以动态生成适应任务变化的智能体身份标识。该框架通过引入因果Transformer模型,在每一轮训练/推理过程中根据任务上下文生成唯一且具有语义可解释性的智能体身份,并将其融合入联合价值函数建模中,从而提升策略在不同任务配置中的泛化表现。在具体实现上,CAID包括上下文提取模块、身份生成模块与融合策略模块三部分。上下文提取模块利用任务配置参数构建环境语义向量,身份生成模块以Transformer结构为核心,结合历史观测序列与上下文语义生成个性化身份向量,将该身份嵌入输入流,以辅助全局Q值估计。

论文在SMACv2等多个挑战性上下文多智能体环境中进行测试,验证CAID在未见任务上的泛化性能,并与ROMA、RODE、QMIX等主流方法进行对比,结果显示,CAID在泛化测试任务中的平均回报显著优于对比方法,在不同任务配置下展现出更强的鲁棒性与转移能力。进一步的消融研究与可视化分析(如t-SNE)也揭示了身份生成机制在表征学习和任务适应中的关键作用。

本研究提出了多智能体泛化场景下的身份建模新范式,为理解任务变化对多智能体策略影响提供了理论视角,具有重要的研究价值与实际意义,后续将推动面向现实任务的多智能体系统更具适应性与通用性。

国际机器学习大会(ICML,International Conference on Machine Learning),是全球人工智能领域的顶级会议之一,是中国计算机学会A类推荐会议。诺贝尔奖和图灵奖获得者Geoffery Hinton、谷歌DeepMind等世界知名研究团队的重量级论文都曾发表在ICML上,产生了众多具有深刻影响力的研究成果。该论文是山东大学在ICML会议上在多智能体强化学习方向的重要突破。


【供稿单位:人工智能学院    作者:杨锐    编辑:新闻网工作室    责任编辑:蒋晓涵 董垣杉  】

 匿名发布 验证码 看不清楚,换张图片
0条评论    共1页   当前第1拖动光标可翻页查看更多评论

免责声明

您是本站的第: 位访客
版权

欢迎关注山大视点微信