学习强国

微信

山大发布

抖音

视频号

微博

小红书

快手

哔哩哔哩

山东大学报

学术预告

数学学院珠峰论坛第356期:Nesterov加速与高精度微分方程

发布:山东大学融媒体中心 日期:2021年09月01日

一、题目

Nesterov加速与高精度微分方程

二、主讲人

史斌

三、摘要

连续的常微分方程是用来学习梯以度为基础的优化算法。现存的连续极限的常微分方程无法区分强凸函数情况下的Nesterov加速算法和Polayk重球法,在这里,我们引进物理学中简化复杂微分方程的连续逼近的思想,采用一阶逼近所生成常微分方程,成为高精度微分方程。将展示:(1)这些高精度的微分方程提供一个一般性的Lyapunov框架来分析连续时间和离散时间的收敛性。这些高精度微分方程拥有着更精确的替代,不仅可以区分强凸函数下的Nesterov加速算法和Polyak重球法,更是可以发现特殊的一项“梯度矫正项”存在于强凸函数下的Nesterov加速算法中,而不存在于Polayk重球法中,从本质上区别了这两个算法。(2)对于一般凸函数意义下的Nesterov加速算法,通过这个高精度常微分方程框架,我们发现了其梯度模的平方自身就有O(1/k^3)的收敛速度。(3)同时对于alpha>3时,更一般的Nesterov加速算法,通过我们的高精度微分方程框架,我们可以获得更进一步的结果,猜测其梯度模的平方可能有o(1/k^3)的收敛速度。

四、主讲人简介

史斌,中国科学院数学与系统科学研究院副研究员,入选中科院百人计划。

五、邀请人

赵翀 数学学院副教授

六、时间

9月10日(周五)16:00

七、地点

腾讯会议,会议号:242107980

八、主办方

山东大学数学学院


【供稿单位:数学学院     作者:桑军帅    责任编辑:蒋晓涵】