[本站讯]近日,软件学院余国先与崔立真教授团队合作在开放环境下机器学习理论及其在生物医学数据分析应用领域取得一系列新进展,多篇研究成果发表在人工智能、数据挖掘、生物信息学领域著名国际学术期刊和会议上,山东大学均为第一作者和通讯作者单位。

小样本学习(Few-Shot Learning)作为机器学习的重要研究领域,旨在突破开放环境中有限样本和分布漂移等限制,模仿人类的认知能力,仅通过少量的观察样本训练使得深度模型进行精准的推理与泛化,被广泛应用于图像识别、推荐系统等多个领域。研究团队面向小样本学习中数据噪声标记强干扰等问题,提出噪声数据下特征与标签协同的少样本学习网络,相关成果“Few-shot Partial Label Learning”和“Few-shot Partial Multi-Label Learning”发表于人工智能CCF A类会议IJCAI2021和CCF B类会议ICDM2021上;针对结构复杂样本,设计成本节省的主动查询和标注策略,在有效嵌入专家知识的前提下显著提高学习器性能,成果“CMAL: Cost-effective Multi-label Active Learning by Querying Subexamples”和“Multi-view Multi-instance Multi-label Active Learning”分别发表于CCF A类期刊IEEE TKDE 2022(IF=9.235)和中科院1区Top期刊 IEEE TNNLS 2022(IF=14.225)上;团队也深化研究了小样本学习在多机构敏感数据可信协同学习中的应用,提出了个性化的联邦少样本学习方法,克服了多机构私有样本少和非独立同分布难题,成果“Personalized Federated Few-Shot Learning”发表于IEEE TNNLS 2022(IF=14.225)。
团队将上述开放环境下的机器学习研究成果拓展应用于生物医学大数据分析领域,在生物知识图谱表示与生物分子功能精细标注、多组学数据建模与智能融合分析和疾病诊断与致病分子识别等领域进行了系统性的应用研究工作,相关成果发表于Bioinformatics 2021/2022(中科院1区,IF=6.931),Information Fusion 2020(中科院1区,IF=17.564),Briefings in Bioinformatics 2021(中科院1区,IF=13.994)等领域知名期刊上。

余国先教授团队聚焦开放环境下的机器学习建模理论及其在生物信息分析领域的应用研究,强调源头创新和应用创新的双轮驱动,围绕领域前沿科学难题和国家需求精耕细作,曾获省部级科技奖励2项,上述研究成果受国家自然科学基金重点、面上、应急管理,山东省重大科技创新工程,阿里巴巴全球研究计划等项目资助。
文章链接:
1.Few-Shot Partial-Label Learning
2.Few-Shot Partial Multi-Label Learning
3.Personalized Federated Few-Shot Learning
4.CMAL: Cost-Effective Multi-Label Active Learning by Querying Subexamples
5.Multiview Multi-Instance Multilabel Active Learning
6.DMIL-IsoFun: predicting isoform function using deep multi-instance learning
7.Isoform function prediction by Gene Ontology embedding
8.Attributed heterogeneous network fusion via collaborative matrix tri-factorization
9.Cooperative driver pathway discovery via fusion of multi-relational data of genes, miRNAs and pathways