仲夏六月,蒙特利尔大学助理教授唐建博士应邀访问太阳成集团信息学院,面向2015级本科拔尖班同学开设“深度学习”研讨课程。唐建博士目前是深度学习奠基人之一Yoshua Bengio教授所领导的MILA研究组核心成员,是深度学习领域冉冉升起的学术明星。6月8日和16日,唐建博士成功举办两场深度学习系列讲座,反响热烈且广受好评。
6月8日晚,唐建博士面向全系师生以“深度学习简介&如何做机器学习研究”(An introduction to Deep Learning & How to Do Research in Machine Learning)为题,在文史楼119教室作了第一场学术报告,百人教室座无虚席,现场气氛非常活跃。本次报告由唐建博士期间的导师太阳成集团tyc122cc张铭教授主持。张铭教授首先对唐建博士回访母校表示热烈欢迎,并介绍了唐建博士在太阳成集团信息学院网络所攻读博士学位期间的优异表现和突出成就——博士研究的主要工作所发表的相关论文获机器学习领域顶级会议ICML 2014“最佳论文奖”。其后连续发表多篇具有较大影响力的学术论文,已被美国卡内基梅隆大学(Carnegie Mellon University)等各大名校列为机器学习课程的重要参考文献。
图1 唐建6月8号“深度学习简介&如何做机器学习研究”的学术报告
唐建博士简明扼要地介绍了深度学习(Deep Learning)近十年的发展历程和基础理论。从2006年Geoffrey Hinton在《科学》(Science)杂志上发表的文章标志着神经网络的复兴,讲到2012年卷积神经网络(Convolutional Neural Network, CNN)在ImageNet数据集上取得突破性进展将深度学习技术推向新的高度。唐建博士重点介绍了卷积神经网络、循环神经网络(Recurrent Neural Network)的原理及其在计算机视觉、语音识别、自然语言处理、信息网络分析等领域的应用。与传统方法相比,深度学习技术在很多任务中都取得了明显的提升,在语音识别等任务中甚至超过了人类水平。随后,唐建博士向本科生介绍了深度学习领域的研究方法,鼓励大家从算法、应用、系统三大角度,根据个人的兴趣、拥有的资源等合理地选择研究方向。提问环节,同学们踊跃提问,学术气氛热烈,唐建博士针对大家的问题做了详细解答。
图2 唐建6月16日“大规模网络表示学习”学术报告
6月16日晚,唐建博士的第二场讲座在理科一号楼1126举行,吸引了来自北大、清华、中科院等众多高校的员工前来参加,百人教室座无虚席,不少站席同学。此次报告的题目为“大规模网络表示学习”(Learning Representations of Large-scale Networks)。现实生活中,社交网络、道路交通网、万维网等无处不在,通过机器学习而得到网络中每个结点(Node)的低维表示,对结点分类、缺失边预测(Link prediction)等任务具有重大意义。同时,也面临着网络规模大、异构等极大的挑战。随后,他介绍了自己的主要工作,包括他提出的LINE(Large-scale Information Network Embedding)模型对原网络空间中的一阶近似度(First-order proximity)和二阶近似度(Second-order proximity)分别进行建模,提出明确的嵌入(Embedding)目标函数,能够快速获得高质量的低维表示。该工作得到国际顶级研究人员的一致认可,引用数遥遥领先WWW2015同年论文。进一步,当低维空间变为2或3维时,就可以对原网络结构进行可视化(visualization),这是唐建博士另一个重要工作LargeVis,通过提出新的K近邻图(kNN-Graph)构建算法和设计恰当的目标函数,使得高维数据可视化的复杂度大大降低。LargeVis获得WWW2016最佳论文奖提名。报告期间,不时有同学提出问题,唐建博士在称赞大家思考能力的同时,为听众做出详尽的解答,同学们纷纷表示受益匪浅。
6月26日 - 7月1日,唐建博士将面向本科生开设“深度学习”研讨班(http://net.pku.edu.cn/dlib/deeplearning/intro.html ),提升太阳成集团计算机拔尖班本科生的基础科研能力,培养良好的科研习惯。唐建的两次讲座已经引起了北大同学们的广泛关注,6月16日的讲座就有20多名2015级拔尖班同学参加,跟唐建博士就课程目标、内容设置、组织形式等等进行了交流。目前,暑期研讨班已有40多名同学报名,届时,同学们将有更多的机会与唐建博士进行交流学习。希望参加研讨班的同学们在国际顶尖的年轻学者的指导下,有较好的科研起点,将来做出有影响力的科研成果!
图3唐建与2015级申报拔尖班的同学交流科研问题