【编者按】一代人有一代人的使命,一代人有一代人的担当。面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,一大批浙大青年科学家踔厉奋发、笃行不怠,把个人理想追求融入实现中华民族伟大复兴的奋斗历程。融媒体中心推出“浙大追梦人”专栏,聚焦奋进卓越的青年群体,讲述他们的精彩故事,展示他们勇攀高峰、刻苦钻研的精神。今天,一起走近浙江大学求是讲席教授、浙江大学数据科学研究中心主任孙文光教授。

从美国洛杉矶到中国杭州,跨越东西半球;从南加利福尼亚大学到浙江大学,深挖数据信息的科研热情从未退却……四十而不惑,一张关于数据科学发展的宏伟蓝图,在这位学者的心中铺陈开来。

2022年初,已是美国南加利福尼亚大学马绍尔商学院终身正教授的孙文光回国全职加盟浙大,担任浙江大学数据科学研究中心主任。

“回‘家’的感觉很幸福。我期待从浙大出发,走向数据科学领域更广阔的舞台。”孙文光说。



01 毅然归国,搭建数据科学的辉煌宫殿


走进孙文光的办公室,满柜子的文献资料颇为引人注目。“为了把这些书运回国,可费了不少劲儿。”说起自己回国加盟浙大的故事,孙文光难掩兴奋和激动之情。

他与浙大的缘分,从幼时学过的有关杭州的古诗词开始;留美期间,他的博士生导师、浙大校友蔡天文教授对浙大的介绍,激发了他对浙大的期待和向往;工作期间多次拜访杭州,江南山水的柔美宛转在他心中留下了美好的回忆;成立于2017年5月的“浙江大学数据科学研究中心”更为他科研事业的发展提供了大展拳脚的平台。

孙文光1.jpg

“浙大在数据科学领域远见的布局、前瞻性的探索和高度的重视让我备受鼓舞。”在孙文光眼里,这个融合了数学、统计学和计算机科学的领域充满了不可言说的“美”——美在思想,美在应用,美在创新。数据科学研究中心的未来在他深入细致的思考规划之下,更加清晰起来:

要占领学术高地,强化数理支撑,特别是要融合数学的基础理论、统计学的模型思维和分析框架、机器学习领域的高效算法和管理科学的决策体系,来发展由数据驱动的兼具实用性和创新性的分析工具;

要面向国家重大需求与科技前沿,推进院系合作,引领学科交叉,让数据科学与商业、教育、医学等不同领域的相关学科协同发展;

要建设人才高地,引进和培养多层次的数据科学人才,依托浙大丰富的教育资源、良好的科研环境和深厚的学科传承,让人才千里马竞相奔腾。



02 年轻有为,深耕数据科学宝库


2009年获得宾夕法尼亚大学最佳博士论文奖,2013年因在“大范围多重假设检验”领域深入而系统的研究获美国国家科学基金会杰出青年教授职业奖,2018年在英国皇家统计学会期刊发表讨论文章并受邀做专题报告,2013和2021年两次获得南加利福尼亚大学马绍尔商学院杰出研究奖,2010年至2022年作为主要负责人连续四次获得美国自然科学基金,2022年获马绍尔商学院MBA核心课程最佳教学奖……

一条条履历,诉说着这位数据科学专家的非凡经历,由此也能看出他深耕数据科学宝库的底气与实力。

孙文光提出的“大范围多重假设检验和错误发现率控制方法”为从海量和高维的数据中发掘价值提供了一个有力的工具。这项统计方法在基因组学、蛋白质组学、生物制药、图像分析和金融学等重要大数据应用领域中,可以帮助研究者从几千个甚至上百万个变量中迅速准确地找到重要变量以及有用信息。

在博士论文中,他创造性地推导出了关于控制错误发现率具有最优性的初步解决方案。毕业之后,他将成果拓展到了更有挑战性的具有相关结构、组群结构、异方差结构、空间结构、分层结构等不同数据类型。这些成果让他在2013年获得了美国国家科学基金会杰出青年教授奖——在统计方向,这项荣誉每年仅颁发给4位最有潜力的年轻学者。


近年来,孙文光聚焦于整合分析和迁移学习,探究如何将多源高维数据中重要的结构化信息、关联性信息和外部的相关知识有效整合并纳入最终的统计推断过程。这些方法可以提高最终解决方案的功效、准确度和可解释性。

“我们在处理许多复杂的大数据问题时常常会采用华丽炫目的分析工具和算法,但研究问题不能迷失在技术性的细节中。深入理解并不断拓展统计学的经典思想和基础原理可以帮助我们从整体的角度去思考和探索,不在海量的数据和复杂的算法中迷失。”孙文光说。 



03 推广数据科学,点亮教学的明灯


在获得的众多奖项中,颇令孙文光自豪的一个是南加大马绍尔商学院颁发的“Golden Apple最佳教学奖”。学生们经过两年MBA学习之后,在所有学习过的核心课程中投票选择对自己影响最大的一门课——这珍贵的一票纷纷被投给了孙文光的《数据科学》。

“同学们对数据科学从畏惧到热爱,是对我这些年努力的最大肯定。”经过三年的不断迭代,他成功把《商业统计和数据科学》这门令人生畏的枯燥课程变成“爆款”。

在课程中,孙文光精心设计教学案例,深入浅出地介绍现代统计学思想和机器学习方法。他与商学院的同事们共同设计了一系列交叉课程,在一个课堂共同授课,教会学生如何综合运用数据科学、市场营销学和金融学的知识解决实际的商业决策问题。


“我一直对教学抱有极大的热情,这是我所从事职业的最大乐趣之一。”孙文光说,“我未来计划利用浙大的云平台办一些数据科学系列讲座,用深入浅出和通俗易懂的方式传播数据科学知识,让更多的人认识和喜爱这门学科。”

如今的数据科学中心,正面向全校本科生开放夏令营名额,未来的那个你,或许能够在这门理论与应用并进、前景无限的学科中找到毕生所爱。







文字记者:周亦颖丨浙江大学融媒体中心学生记者团 彭静怡

摄影:高兴就好 蛋挞
部分照片由受访者本人提供,相关人才信息由人才办提供
今日编辑:浙江大学融媒体中心记者团 何瑞婧
责任编辑:周亦颖





来源:浙江大学数据科学研究中心