编者按:算力基础设施作为各个行业信息系统运行的算力载体,已成为经济社会运行不可或缺的关键基础设施,在数字经济发展中扮演着至关重要的角色。前不久,在国新办举行的“权威部门话开局”新闻发布会上,工信部表示将研究制定算力基础设施发展行动计划。
近来,ChatGPT等相关人工智能应用火爆出圈,在庞大用户群涌入的情况下,也催生了对算力基础设施建设更高的要求。有研究指出,类似OpenAI等使用的大模型训练将成为未来发展趋势,而训练任务中使用的算力呈指数级增长,催生了对算力更大的需求。
算力基础设施建设该如何布局,如何推动算力基础设施绿色低碳发展,在打造全国算力一张网的过程中还需要注意哪些问题?
针对这些疑问,本报推出“算力基础设施高质量发展系列观察”,从不同角度分析推进算力基础设施高质量发展,本文为系列观察第一期:建设篇。
算力作为数字经济时代的关键生产力,在经济社会各领域都得到了广泛应用。
算力基础设施作为各个行业信息系统运行的算力载体,是新基建的核心组成部分,已成为经济社会运行不可或缺的关键基础设施,在数字经济发展中扮演着至关重要的角色。
截至2022年底,全国在用数据中心机架总规模超过650万标准机架,算力总规模达到180EFlops,位居全球第二,算力总规模近五年年均增速超过25%,存力总规模超过1000EB。
近年来,我国对算力基础设施的重视程度不断提升。“东数西算”工程正式启动以来,算力产业布局得到一定程度的改善。数据中心集约化、规模化、绿色化的发展路径,为上下游企业带来新的发展机遇。然而,算力基础设施内涵外延广泛,建设运营主体丰富,技术环节众多,仍需多方统筹协调、共同参与,促进其高质量发展。
ChatGPT爆火对算力基建提出新要求
近日,太平洋证券在其最新的报告中分析了AI的架构体系,指出OpenAI使用的大模型训练将成为未来发展趋势。
随着ChatGPT的爆火,以大模型、大数据、高算力为基础的人工智能内容自动生成技术(AIGC)被推上“热搜”,进而打开市场对算力需求的想象空间。
ChatGPT自发布以来用户数量快速增长。在庞大用户群涌入的情况下,ChatGPT服务器2天宕机5次。根据OpenAI近日发布的数据,自2012年以来人工智能训练任务中使用的算力呈指数级增长,其增长速度为每3.5个月翻一倍。截至目前人们对算力的需求已增长超过30万倍。人工智能三大要素包括数据、算法以及算力。AI技术的演进使人工智能训练任务中使用的算力呈指数级增长,催生了对算力方面更大的需求。
“企业数字化转型往往要用到算力,如数字孪生、工业设计、电网建模等领域都是算力消费的主力,但并不意味着这些企业需要自建算力系统。”中国工程院院士邬贺铨表示,通过算力调度交易平台连接算力网的业务提供者,实现跨服务器和跨数据中心的数据调度和融合计算,提供足够的算力。
除了算力,还有算法。邬贺铨进一步指出,GPT-4为算法模型提供了一个很好的应用范本。“过去无论计算什么,都要动用整个模型的所有部分,现在实际上只需针对性地动用部分算法,这是通用人工智能带来的变化。”邬贺铨告诉记者。
“一方面,算力是数字经济中所有应用和服务的基础与支撑,可加速电子信息制造业等信息技术产业创新发展;另一方面,算力的提升也可以使企业和组织能够更快、更有效地处理与分析数据,从而提高生产力、降低成本、提高客户满意度。”中国移动通信联合会元宇宙产业委执行主任于佳宁在接受媒体采访时表示。
亚洲区块链产业研究院副院长、河北金融学院教授赵永新认为,当前我国在算力方面应进一步加强超算中心、智算中心和边缘数据中心建设,不断满足政府、行业、企业甚至个人等多样化的智能场景需要。同时,实施“东数西算”国家工程,将东部密集的算力需求有序引导到西部,使数据要素跨域流动,实现全国算力统一协调。此外,要加强以算力赋能智慧城市、智慧医疗、智慧农业等,实现千行百业高质量发展。
多方协同建设“东数西算”初见成效
2022年2月,国家发改委、工信部等多部门联合印发文件,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏启动建设国家算力枢纽节点,并规划了10个国家级数据中心集群。至此,全国一体化大数据中心体系完成总体布局设计,“东数西算”工程正式全面启动。
如今,“东数西算”工程已历时一年多。根据中国信通院统计数据,截至2022年9月,东部枢纽节点在用数据中心机架数超过368万标准机架,西部枢纽节点在用数据中心机架数超过80万标准机架。
另一组于2022年9月公布的数据显示,“东数西算”工程新开工数据中心项目高达60多个,新建数据中心规模超过110万标准机架,总投资超过4000亿元。
“数据中心在算力基础设施总体规模中占比最高,超过90%,未来几年数据中心规模将保持年均20%的增速。”中国信通院云大所副所长李洁表示,算力基础设施能够促进数字基础设施的建设发展,有助于实现供给侧结构性改革,实现新旧动能转换、增长方式转型的经济高质量发展。
“数据分为冷数据和热数据,热数据主要是一些需要实时性计算的数据,冷数据相对不需要实时性,国家的八大算力枢纽,实际上西部主要在处理冷数据和一些本地数据,东部主要是处理热数据。”邬贺铨表示。
不一定过度强调“东数西算”,面对不同应用场景,还可能有东数东算、南数北算等模式,应因地制宜。但无论哪种模式,都有着共同的目标,一是促进数据中心资源最大化共享、流通和利用;二是通过数据中心的系统化布局,促进国家碳达峰、碳中和目标实现。
在中国工程院院士郑纬民看来,“东数西算”工程面对更广域、更多方参与和更高品质要求下的数据与应用流动场景,现有的技术储备、工程建设水平、市场化等方面仍面临着大量挑战。
布局算力产业有序推进算力基建高质量发展
2021年,工信部印发《新型数据中心发展三年行动计划(2021—2023年)》,在产业布局方面,指出要引导数据中心集约化和高密化建设,引导高性能算力的部署,逐步提高自主研发算力的部署比例,加快数据中心智能化建设,推进新型数据中心算力供应多元化从而支撑各类智能应用。该行动计划为算力基础设施的科学布局提供了方向。
然而,在算力基础设施方面,“当前数据中心规模占比最高,而超算中心、智算中心和边缘数据中心总体规模较小,出现专用算力不足、部分地区通用算力过剩、能耗成本过高的局面,无法满足国防科技、产业转型和社会生活对于多元普惠算力的需求。”李洁表示。
此外,国内算力布局存在供需对接失衡的情况,主要体现在3个方面:一是中西部地区算力过剩;二是用于产业互联网的算力不足;三是算力使用门槛较高,企业缺乏相关数字化转型人才,无法直接使用算力资源。
国家信息中心大数据发展部在此前发表的一篇论文中指出,当前我国仍存在一些束缚大数据发展的瓶颈性问题亟待解决。其中排在前两位的是数据中心布局分散和算力资源结构失衡。对此,他们提出建议,要优化数据中心基础设施建设布局,建设国家“数网”体系,有效引导东部部分对时延要求不高的应用需求有序向西部迁移,协同解决算力资源结构性失衡问题,实现总体时空布局优化、成本优化、安全管控优化。
“目前来看,我国算力产业主要呈现高速增长、技术领先、算力资源集中的特点。”于佳宁表示,由于相关企业多集中分布于我国东部地区,导致现有数据中心布局东多西少,东西部算力资源差距较大。
实际上,随着AIGC引发高算力需求,我国产业相关方迎来投资机遇。华泰证券表示,AIGC等技术的应用背后离不开庞大的算力支撑,将会推动算力基础设施升级换代。而在AIGC加速商业化的过程中,通信多板块有望获益。
赵永新对此表示,要增强自主可控高端芯片生产能力,通过设备更新、工艺创新等方式,争取在量子芯片领域实现突破。同时,在核心算法、机器学习、神经网络以及多种技术模型等领域加大研发力度。此外,要进一步加大算力产业政策支持和加强算力人才培养。