从数据特征理解深度学习

报告简介:

理解深度学习在实际问题中的性能需要考虑模型特征、数据特征以及连接这两部分的优化算法的特征。该报告将从函数频率、有效复杂度、信噪比、推理复杂度、关联统计量等角度来分析数据特征,并设计实验来挖掘模型和优化的特征,以理解深度学习的泛化能力和语言模型的推理能力,并对实际的模型训练提供一些参考。

报告人简介:

许志钦
上海交通大学自然科学研究院/数学科学学院教授。2012 年本科毕业于上海交通大学致远学院。2016 年博士毕业于上海交通大学,获应用数学博士学位。 2016 年至 2019 年,在纽约大学阿布扎比分校和柯朗研究所做博士后。研究兴趣是深度学习的数学基础与应用。