2020年11月21日,由浙江大学数据科学研究中心主办的“2020浙江大学数据科学研究中心交叉论坛”在浙江大学紫金港校区校友楼西溪厅举办,来自浙江大学管理学院、数学科学学院、经济学院、信息与电子工程学院、浙江大学化学系、杭州师范大学物理系、浙江大学数据科学研究中心的学者齐聚一堂,共同讨论数据科学的交叉与运用,并与在场的师生分享了各自的最新工作成果。会议由浙江大学数据科学研究中心副主任张立新教授主持,采取线下会议与腾讯线上会议同步直播形式。
浙江大学数据科学研究中心副主任 张立新教授
浙江大学化学系特聘研究员洪鑫围绕“基于机制认识的合成反应机器学习预测”做出了1小时前沿交叉学术报告。报告中洪鑫研究员提到,作为构筑功能分子的核心手段,合成反应的优化与设计是精准合成的关键目标。理论与计算化学的长足发展促进了实验与计算的深度融合,逐渐形成了“实验-计算”协同的合成体系优化策略。得益于化学大数据的迅速积累与人工智能技术的蓬勃发展,人工智能与合成化学的交叉融合为海量合成化学空间的探索提供了全新的方法论。基于机器学习的合成反应精准设计和智能优化有望成为下一代优化策略,助力合成化学的精准设计。本报告将探讨基于机制认识的合成反应机器学习预测以及其中亟待解决的科学问题。
浙江大学化学系特聘研究员 洪鑫
浙江大学管理学院“百人计划研究员”、博士生导师张政研究员做了“浅谈运筹优化技术在医疗运作管理中的应用”的报告,他简要介绍了运筹学的背景、模型、算法、以及运筹优化技术在医疗运作管理中的应用情况。重点介绍以下三类应用问题:1. 基于随机优化算法的门诊预约调度优化;2. 基于随机规划和鲁棒优化的手术室指派调度优化;3. 基于随机规划和分解算法的癌症筛查策略优化。
浙江大学管理学院“百人计划研究员”、博士生导师 张政
浙江大学信息与电子工程学院“百人计划”研究员,博士生导师李旻主要研究方向是网络信息论、新型无线通信系统设计与优化、机器学习及其在无线通信中的应用、信息安全,致力于以信息理论、通信理论作为基础和重要手段,以有效地利用频谱、能量、存储与计算等宝贵的网络资源来实现可靠安全通信为目标,展开一系列基础性的网络建模与容量分析、新型传输方法研究与算法设计。他介绍了统计分析的信息理论带无线通信中的运用。随着智能手机、移动平板电脑和物联网设备等无线设备的普及,无线蜂窝网络迎来了大数据时代。虽然5G的商业推广已经开始在全球范围内展开,但它仍未能实现人们所期望的超低能耗、超低成本的大数据超高速传输。在这次演讲中,他首先介绍一些5G演进的基本概念和技术,以及实现更快更智能通信的6G。然后展示如何运用信息理论和统计分析来推动创新的传播设计。本文将讨论两个重要的应用实例,一个是用于更快通信的毫米波波束对准,另一个是用于智能通信的信息瓶颈。
浙江大学信息与电子工程学院“百人计划”研究员,博士生导师 李旻
浙江大学数学学院张庆海教授主要研究领域是动边界流体的高保真算法,也应用计算的手段探究了一些多相流问题;他做了模拟具有不规则和移动边界的流体的报告。在模拟具有移动边界的流体时,现有方法通过将几何和拓扑转化为数值求解偏微分方程来避免几何和拓扑问题。为了消除这种方法的局限性,我们用几何和拓扑工具来处理几何和拓扑问题。
浙江大学数学科学学院 张庆海教授
浙江大学数据科学研究中心“百人计划”研究员、博士生导师林俊宏的主要研究方向为学习理论和压缩感知理论。他分享了随机梯度法的隐式正则化的相关内容,并分析了随机梯度法(SGM)在允许多次传递数据时的学习性质。
浙江大学数据科学研究中心“百人计划”研究员、博士生导师 林俊宏
浙江大学数据科学研究中心“百人计划”研究员,博士生导师骆威的学术研究方向包括充分降维以及因果推断等相关应用。他围绕充分降维度和因果推理分享了自己的研究。重点将放在实际数据的应用上,以说明这些统计方法在实践中的有效性。
浙江大学数据科学研究中心“百人计划”研究员、博士生导师 骆威
现场热烈交流
浙江大学经济学院金融系副教授、金融风险分析师(FRM)曾涛围绕“模型选择的异常行为信息标准:证明与变异”进行了探讨。Deviance信息准则(DIC)被广泛应用于基于MCMC输出进行模型选择。虽然它被理解为贝叶斯版本的AIC,一个严格的证明没有提供在文献中。在本次研究中,证明当使用插件预测分布,DIC可以有一个严格的决策理论证明在频率的设置。在一组正则性条件下,DIC选择了一个能在数据生成过程(DGP)和插件预测分布之间渐近地给出最小期望Kullback-Leibler散度的模型。提出了一种基于贝叶斯预测分布的DIC替代表达式。新的DIC比原来的DIC有更小的惩罚项,并且很容易从MCMC的输出计算。该方法对重新参数化具有不变性,且渐近地产生比原始DIC更小的期望损失。
浙江大学经济学院金融系副教授, 经济学博士,金融风险分析师(FRM) 曾涛
浙江大学经济学院“百人计划”研究员刘晓彬的研究方向为计量经济学、金融计量和贝叶斯计量经济学。本次他做了“用于假设检验的基于后验的瓦尔德型统计量”的报告,提出了一种新的基于贝叶斯后验分布的瓦尔德统计量进行假设检验。该方法可应用于微观计量经济学和金融计量经济学中的两个潜在变量模型。
浙江大学经济学院“百人计划”研究员 刘晓彬
围绕“基于最优传输的域自适应迁移学习”, 浙江大学数据科学研究中心 “百人计划”研究员徐仁军介绍了领域自适应学习通过利用源域的标记数据来适应未标记的目标域来学习一个好的分类器,并取得了巨大的成功。然而当目标域包含源域中从未观察到的类时,即在开放域自适应学习中,现有的领域自适应方法由于额外未知类的干扰而无法工作。这是一个更具挑战性的问题,因为它很容易由于未知类和已知类之间的不匹配而导致负迁移。现有研究中,目标域未知样本在特征空间中分布在决策边界附近时,从标记的源域学习容易产生误分类。为了克服这一问题,我们提出了联合部分最优传输,它充分利用了源标记域的信息和目标域中未知类的判别表示。提出的联合判别原型紧致损失方法不仅可以实现类内紧致和类间可分性,而且可以通过反向传播估计未知类的均值和方差,这是以往方法因为对未知类结构的一无所知而难以解决的问题。据我们所知,这是开放域自适应学习的第一个最优传输模型。同时大量实验证实,我们提出的模型能够显著提高开放域自适应学习在自适应学习标准测试数据集上的性能。
浙江大学数据科学研究中心“百人计划”研究员 徐仁军
杭州师范大学物理系周能吉副教授介绍了“相变和临界现象的数值模拟研究“的最新成果,。他指出相变和临界现象作为物理领域,特别是统计物理领域一个重要的研究课题,一直以来都受到广泛的关注。本次报告结合自身研究经历,从铁磁材料有序-无序相变现象、磁性薄膜中畴壁运动的钉扎相变现象、铁基超导材料中的反铁磁相变现象,以及开放量子系统中的基态量子相变现象等方面,简略介绍如何应用数值方法研究相变和临界现象,确定相变类型、临界温度以及临界指数值。相变现象是非常复杂的,而数值模拟获得的数据又是海量的,如何从中挖掘出有用的信息,更有效地刻画各种临界现象,是本次报告的重点。
杭州师范大学物理系 副教授 周能吉
浙江大学数据科学研究中心“百人计划”研究员,博士生导师苗晓晔,分享了自己在“复杂异构数据查询处理“领域的研究成果。她讲到,查询是计算机科学的基本问题,存在于几乎所有的应用领域。她围绕“数据不完整性、图数据复杂性和查询质量低劣”三个方面介绍复杂异构数据查询处理技术,具体介绍不完整数据索引与查询处理、复杂图数据查询处理与交互、复杂数据查询结果质量优化。同时,展望数据经济下的数据管理研究。
浙江大学数据科学研究中心“百人计划”研究员,博士生导师 苗晓晔
本次研讨会得到了浙江大学浙江大学数学科学学院统计系的支持,跨学科、跨专业的学者分享研究成果、交流思想,共同探讨数据科学交叉领域的最新研究成果,为交叉科学的研究提供了有力的助推,为多学科的合作搭建了有益的平台,数据科学的交叉应用场景将随着各项研究的推进打开新的局面。