3月23日下午,“华师大——OceanBase分布式数据库联合实验室研讨会”在地理馆301召开。OceanBase公司CTO阳振坤,蚂蚁集团研究员、OceanBase首席架构师杨传辉及公司其他代表,华东师范大学校党委常委、副校长周傲英,数据学院院长钱卫宁,副院长周烜,以及多名从事数据库系统科研工作的师生出席了此次会议,研讨会由副院长周烜主持。
周校长指出,2020年到2021年是中国的数据库爆发的一年,想要在这个时代脱颖而出,就需要在过去的基础之上开拓创新,重新定义分布式数据库的概念,这需要与企业的联合、创新,共同发展硬核科技。周校长强调,硬核科技不仅要有企业成功的应用,更要体系化,形成相应的概念和理论,这正需要教育机构与企业的“联动”。OceanBase公司提供硬核的技术支持,数据学院将技术提炼成理论,反过来推动技术的开发,满足新的应用需求,进而形成一个正向的循环。在谈及在2020年9月与OceanBase创立联合实验室的目的时,周校长强调了两点:一是要在当前中国大力发展数字经济的背景下,发展以中国为主的硬核科技,建立中国自己的分布式数据库理论体系;二是要培养中国自己的数据人才。同时,他鼓励同学们要融入开发过程,勇于做“数据先锋”。希望OceanBase公司与数据学院两个不同机构的团队能深度融合,发生“化学反应”。
阳振坤老师首先向同学们分享了自己在十年前做分布式数据库研究的初衷——将数据库和分布式两个领域结合,创造更多机会。经过技术人员们十多年的努力才彻底掌握了数据库,并借此鼓励数据学院师生要坚持在某个领域刻苦钻研,专注研究当前分布式数据库仍存在的问题,共同促进分布式数据库更长远的发展。
OceanBase资深技术专家封仲淹谈了与高校合作的目的。一是培训和教程,将先驱技术引入到作业实践中去,提高核心竞争力;二是在高校的核心理论指导下助推科研项目,“产学结合”,产生新的文化,新的思想,新的思维,使实验成果落地。
学院领导对封仲淹老师的建议作出回应。钱卫宁院长指出,与企业联合开展研究,一是要打破学生“做研究只是为了发表论文”的传统看法,引导学生思考并解决核心问题;二是要通过学生自身的研究成果,为学生在未来工作中建立自信心,对学生起到正向的激励作用;三是希望能做到研究的连续性,不同届的学生在之前学生所做的研究的基础上继续钻研;四是希望能做到工程落地,构建分布式数据库的生态环境,而不只是停留在技术上的研究。周烜副院长为OceanBase企业代表介绍了我院的数据库课程的建设。
学院三位同学在研讨会上作了相关报告。贺小龙同学报告的主题是“范围分区表的大规模历史数据持续批量加载”,主要介绍了如何通过机器学习预测数据分区的合并时间,通过多轮算法来减少数据加载对正常负载的影响,进而大大提高分布式系统的吞吐量。瞿璐祎同学报告的主题是“应用感知的事务负载生成“,她首先解读了应用感知的概念,而后介绍了Lauca(一款应用感知的仿真工具),指出其可以低成本生成仿真数据和负载,在保证负载仿真准确性(性能指标一致)的同时实现对原始数据的保护。陈梓浩同学报告了“Hybrid Evaluation for Distributed Iterative Matrix Computation(分布式混合迭代矩阵运算)”的相关内容。在座企业代表和学院领导对三位同学的报告提出了建议和改进方向。
蔡鹏、张蓉、徐辰三位教师围绕联合实验室即将展开的科研课题进展作了汇报。蔡鹏老师介绍了研究课题“分布式数据库调参”,通过运用AI技术使数据库具备更好的适应能力,蔡老师提出了两种技术手段,一是运用数据库内部的自适应,二是从数据库外围调整参数,蔡老师提出,下一步的培养目标是让同学们理解每个参数,独立写一些程序并在OB的平台下讨论这些参数。张蓉老师指出现阶段分布式数据库的性能评定存在的关键问题,介绍了团队评测基准的应用场景,对TPCC场景进行改造,通过对它的数据和负载进行扩展以开展评测,并确定了评测基准和评测过程中需要重点评测的指标,包括可扩展性、透明性、高可用性和稳定性,并指出下一步目标是对评测中所关注的问题进行可行性的验证。徐辰老师也在研讨会上对如何将OceanBase与Spark等大数据处理系统的深度融合,利用大数据处理系统提升OceanBase的分析处理能力,支撑面向HTAP的优化等相关课题进行了报告,并指出希望OceanBase提供场景,与大数据的研究体系融合,形成生态圈。
晚上7点,OceanBase首席架构师杨传辉在数学馆113为同学们做了OceanBase数据库产业实践的宣讲报告,介绍了OceanBase过去几年的发展,以及当前工作的重点方向,杨老师指出,集中式数据库已经到头,未来必然是使用分布式数据库,现在的发展在将来可能会带来更多的红利,当然,当下“去Oracle“的工作还是比较艰辛的,但是团队正在努力克服这个问题。
通过此次的研讨以及宣讲活动,数据学院师生和OceanBase团队增进了了解,双方希望进一步深化合作,深入分布式数据库系统的研究,实现共赢共促。
图文:李思琪
排版:林妍妤