数据科学与大数据技术专业,专业代码:080910T,无疑是未来十年最火的专业,甚至没有“之一”。

2020年3月,138所高校获批第五批“数据科学与大数据技术”专业,180 所高校获批新增人工智能本科专业。经过前几年密集的申报、备案与审批,开设“数据科学与大数据技术”专业的高校已达619所,开设“人工智能”专业的高校达215所。再加上“大数据管理与应用专业”、“大数据技术与应用专业”,中国在大数据及人工智能相关领域的高等教育呈现出大爆发态势的同时,版图已经接近确定。这也意味着,经过4年的密集审批期后,“数据科学与大数据技术”专业将进入建设期和考核期。

《普通高等学校本科专业设置管理规定》(教高﹝2012﹞9号)中规定“ 第十八条 高校现设专业连续五年不招生的,原则上按撤销专业处理。第二十六条 高校设置的专业在教育教学过程中出现办学条件严重不足、教学质量低下、就业率过低等情况,高校主管部门须责令有关高校限期整改、暂停招生。”短时间内,这么多高校密集开设“数据科学与大数据技术”专业,必定面临相当程度的竞争,也必将会有部分高校专业的教学质量不达标而面临困境。

数据科学与大数据技术”专业是新兴学科,可供借鉴的经验较少,许多高校对于完整的数据科学与大数据技术专业人才培养,还没有一套成熟的规划方案,各高校在新专业的课程建设路上还是存在着诸多挑战。

首先,投入资金和资源要求高。数据科学相关技术需要的资源配置比较高,这妨碍了许多高校“数据科学与大数据技术”专业落地实施;同时,作为应用型学科,数据科学的教学中需要有大量行业真实数据和项目资源支撑。

其次,学生实践机会少,数据科学来源于各类行业场景,注重实践训练和案例教学,是一门与实践高度结合的学科。要进行大数据分析,必须要有充足的高质量数据和统一的实践平台,然而多数高校缺少企业项目实战案例和可以用于研究的商业数据,使得学生难以做到学以致用。

近期,一份着眼于“数据科学教育”课题的《数据科学教育白皮书》在教育圈内广为流传,首次解答了“数据科学与大数据技术”这一未来十年最火专业应该怎么建设的问题。

《数据科学教育白皮书》由数据科学协同平台企业——Heywhale和鲸科技发起,联合TDU腾云大学、AWS共同推出,通过丰富的行业研究数据,真实的教育实践案例,深度剖析数据科学教学流程中的痛点与机会点,完整呈现了数据科学教育的4大阶段,新学科教育工作者全面梳理数据科学教育知识体系、学习路径、产业实践及生态图谱。

打开腾讯新闻,查看更多图片 >

《数据科学教育白皮书》获得了来自中国人民大学商学院院长毛基业教授、中国人民大学统计与大数据研究院院长艾春荣教授、北京大学光华管理学院商务统计与经济计量系系主任王汉生教授、华东师范大学数据科学与工程学院副院长周烜教授、AWS首席云计算技术顾问费良宏等多位大咖的认可和推荐。

教育部“长江学者”特聘教授,国家杰出青年科学基金项目获得者,中国高被引学者,国际信息系统学会中国分会理事会主席——毛基业教授在序言中这样介绍道:“为什么要加快推进高校的数据科学教育?其知识体系包括哪些内容?如何建设高水平的教育项目?这份白皮书给出了非常好的答案(Why, What and How)。随着中国社会全面进入移动互联时代以及大数据应用的相应普及,市场对数据科学人才的需求巨大。美国高校的数据科学教育项目已经遥遥领先,国内企业和高校学生在供需两端都在急切地呼唤更多更好的数据科学教育项目!”

《数据科学教育白皮书》认为数据科学教育项目有别于传统学科项目,需要具备协同性、整合性、敏捷性和生态化的特征,要完整地打造一体化的数据科学教育项目,需要完成4个阶段性任务以构建完整的教育流程:

第一阶段 : 数据科学知识体系的掌握

数据科学是一门知识体系复合且专业性极强的学科,在数据科学的高校教育中往往会遇到学科背景局限和高校相关资源禀赋匮乏的情况。数据科学是作为通用目的技术(general purpose technology)赋能其他应用场景,因此针对交叉学科的培养、课程大纲设置的科学性、以及教学方式的适用性等带来诸多挑战。高校中针对交叉学科背景的建设的基础较弱,成熟度有待加强。同时,高校基础资源较为分散,教程路径较为固化,也为数据科学教育的推广带来难度。因此一套科学的教纲、知识天梯和流程模块尤为关键。

第二阶段:阶梯式实践路径与实战项目

数据科学作为实操性极强的学科需要科学的实践路径与工具的掌握。但是正因为数据科学的知识体系较为庞杂,因此在实际教学过程中,往往会出现教学平台(工具)的资源缺口和真实数据与案例沉淀缺失的问题。基于此,和鲸认为基于云端化和协同化的数据科学实操,是在以科学的、循序渐进的实践路径中的重要支撑。

实训机制是以让学生完成完整的数据科学项目为导向设置的实践类型,国外已有较多高校开设实训营以培养学生达到能用数据科学方法解决实际项目的目的。在现阶段国内高校中,依旧存在着实训统一工具管理困难、流程设置的科学性、目标与成绩评估和管理等问题。和鲸认为,以项目为导向的数据科学教育要注重“CBL + Design Thinking + 全流程云端工具”,实现“理论知识+数据资源+人才潜力”的汇总,把握真实问题、真实业务,创造真实价值。

第三阶段:真实行业场景中创造业务价值

通用目的技术(General Purpose Technology)是一种能够赋能泛产业实现产业转型升级的底层技术,数据科学教育的真正价值也在于能够帮助学生明确场景的可改造性、技术的可落地性以及技术的可迭代性。但在现阶段的国内数据科学教育中,依旧存在着场景探索缺失的问题,缺失真实场景用于实践、数据难获取以及缺失行业导师的指导解读。和鲸认为,数据科学教育需要充分挖掘不同的应用场景,要梳理一套完整的、科学的和可复用的价值流程,基于流程化的教育管理完成对于学生场景认知的教育,立足于真实的业界场景,完成创造真实价值的落地闭环。

第四阶段:开放生态的深度连接

数据科学教育在国内依旧处于迅速发展的阶段,关于教育生态的资源整合以及学生就业发展选择的路径中,同样存在诸多痛点。如何更好的衔接科学研究与普适学习?如何在把握教育方向的前提下提高科研效率?如何提高教育生态中资源整合的效率?都成为亟需解决的问题。

和鲸认为,背靠协同共享的学习机制,充分调动教育生态中的伙伴资源,打造“数据池+人才池+平台算力支撑+协作共享机制”的闭环,可以加速数据科学的落地效果。

“数据科学是大数据时代应对人类对“数据发现”的需求而成长起来的新兴学科,它具有多学科领域交叉的特点以及实际中的应用性。因此,如何构建多学科领域交叉的人才培养体系,培养复合应用型的创新人才是摆在各国面前的巨大挑战。”中国人民大学统计与大数据研究院院长、教授、博士生导师,美国佛罗里达大学惠灵顿工商管理学院经济系终身教授——艾春荣教授这样推荐道,“和鲸科技与腾云大学发布的《数据科学教育白皮书》,以国际教育的视角审视我国教育现状,并从数据科学的学科价值和教育痛点,推演出“产学研”结合的教育新范式,对我国数据科学教育具有指导和示范意义。”