加强基础研究是实现高水平科技自立自强的迫切要求,是建设世界科技强国的必由之路。北京交通大学信息管理理论与技术国际研究中心(ICIR)研究认为,目前我们正处于新一轮科技革命和产业变革的重要换挡期,从源头和底层解决关键技术问题,成为我们应对国际科技竞争、推动构建新发展格局、实现高质量发展的迫切需要。纵观近300年的工业发展历史,人类社会已经历了蒸汽化、电气化、信息化三次重大科技革命,大幅提高了人的体力劳动效率,极大解放了生产力,现在正处于以提高人的脑力效率为目标、以生成式人工智能为牵引的第四次工业革命时期,我们要筑牢生成式人工智能坚实地基,在第四次科技革命浪潮中实现高水平自立自强。

以ChatGPT为代表的生成式人工智能,开启了全球第四次科技革命浪潮

第一次科技革命——机械化。第一次科技革命发端于18世纪后期的英国,以蒸汽机的发明和广泛应用为标志,生产工具发生了由手工形态向机器形态的质变,使人们从繁重的体力劳动中解放出来,人类社会开始走向机械化时代。

第二次科技革命——电气化。第二次科技革命发端于19世纪的德国和美国,以电动机、发电机和内燃机的发明并在各行各业广泛应用为标志,加速促进了汽车和飞机等新型交通工具的诞生,人类社会进入电气化时代。

第三次科技革命——信息化。第三次科技革命发端于20世纪的美国,电子技术、微电子技术、原子能技术、信息技术、光学技术等相关技术不断进步,半导体晶体管、集成电路、激光、光纤、电磁波等技术产品快速迭代,各行各业的信息化应用不断深化,人类社会进入信息化时代。

第四次科技革命——智能化。随着ChatGPT的出现,意味着一种可以逐步“解放大脑”的智能型生产工具已经出现,将有助于将人类从过去繁重的体力劳动和重复性的脑力劳动中解放出来,以ChatGPT为代表的生成式人工智能将引领人类社会第四次科技革命,成为推动社会发展的新引擎。

我国人工智能产业面临三方面“卡脖子”基础环节

生成式人工智能架构由算力层、平台层、算法层和应用层四层架构组成。其中,算力层主要指人工智能芯片;平台层主要包括数据平台和训练平台等;算法层主要包括自然语言处理(NLP)、计算机视觉(CV)、音视频、多模态等各种大模型和算法;应用层则是面向各种应用场景的人工智能专业服务,如智能客服、聊天机器人、数字人、AI作画、搜索引擎等。我国人工智能产业除在应用层有一定的差异化竞争优势外,在算力层、平台层和算法层等方面,都存在受制于人的“卡脖子”风险。

算力层——人工智能芯片。人工智能芯片是一种专门处理人工智能计算、应用等任务的芯片,主要包括GPU、FPGA、ASIC等不同形态。人工智能模型训练对算力的需求巨大,曾在2016年击败围棋九段高手李世石的“阿尔法狗”用了1202个CPU、176个GPU,约有800多万核并行计算。而目前爆火的ChatGPT模型训练算力至少需要上万颗英伟达GPU A100。

英伟达是全球人工智能芯片GPU的领导厂商,其产品占全球GPU市场份额高达70%,独立显卡领域市场份额更是高达86%。英伟达的GPU A100、H100,以及Thor自动驾驶芯片等,均处于全球绝对领先地位。而我国龙芯、景嘉微、华为海思、摩尔线程、璧仞科技、天数智芯等公司的人工智能芯片还落后很多,如景嘉微JM9231浮点性能只有8TFlops,是英伟达2000TFlops的Thor自动驾驶芯片的1/250。此外,我国人工智能芯片在EDA设计工具、光刻胶等半导体材料、光刻机等半导体设备,以及先进制程芯片加工制造等方面,受到的制约更多。

平台层——云计算平台。庞大的大数据样本和卓越的算力平台基础设施也是人工智能大模型训练的基础。OpenAI直到2019年微软介入后,才开始全力利用微软的大数据和大算力Aruze云平台训练大模型。在大数据方面,GPT-2用于训练的数据集共有约40G、800万篇源自Reddit上高赞的文章;GPT-3模型的训练数据集超过45TB;而ChatGPT的编程能力源自微软收购的Github开源社区。在大算力方面,GPT-3.5在微软高带宽集群Azure AI超算基础设施上进行训练,总算力达3640PF-days,即每秒一千万亿次计算,运行3640天。

微软Azure和谷歌GCP等云平台具有数据量大质高、算力稳定强大的共同特点,成为全球生成式人工智能训练的主要平台,如OpenAI、Meta、Hugging Face等世界领先的人工智能公司都选择微软Azure 开展模型训练。我国的阿里云、腾讯云、华为云等在数据的覆盖面和数据质量方面差距较大,天翼云、移动云、联通云等运营商云在算力技术方面差距较大。适合大模型训练的云平台也成为制约我国人工智能发展的主要瓶颈。

算法层——核心基础算法。人工智能算法包括基础算法和应用算法两种类型。目前几乎全部的基础算法模型都由斯坦福、哈佛、OpenAI、Meta、Hugging Face等美国机构提出,应用算法则几乎完全开源,并且美国各大公司是人工智能开源代码的主要贡献者,对开源社区有绝对控制权。

我国人工智能产业几乎完全依靠全球开源代码和算法发展起来,缺乏自己的底层代码和核心算法等做支撑,存在两方面的突出问题:一是专业性和针对性不够。由于训练框架固定、算法限制,很难得到用户期望的结果,而且难以修改、完善、优化算法。二是不掌握核心算法,被“卡脖子”的风险很大。开源代码已不再具有中立性,已经成为国与国竞争的经济武器,没有自己的底层核心算法,人工智能产业的发展是不安全的。

筑牢基础,在第四次科技革命中实现高水平自立自强

充分发挥新型举国体制优势,聚全社会之力研发人工智能芯片。先进的人工智能芯片是生成式人工智能产业的基础,也是美国限制我国高科技发展的重点领域。我们要抛弃一切幻想,充分发挥新型举国体制优势,充分调动国内外、全社会一切资源,充分利用财政、税收、人才、资金、市场等所有手段,充分发扬“两弹一星”精神、航天精神、新时代北斗精神,聚焦关键环节,实现人工智能芯片的突破,为我国人工智能产业发展奠定坚实基础。

加快体制机制创新,引导云平台企业混改重组。我国现有云平台性能、质量和服务水平距离人工智能大模型训练还有很大差距。一方面,国家有关部门要加大引导不同类型云平台企业的重组力度,实现优势互补;另一方面,要鼓励政企用户多使用公有云,在大量用户使用基础上,提升云平台的服务能力和水平。

加大对基础算法的研究支持力度,鼓励更多数学家参与人工智能研究。我国人工智能产业界应更加重视对基础算法的研究。一是重新组建的科技部应将基础算法研究列为其重大突破方向,加大研究支持力度;二是工信部、农业农村部、国家发改委等部门应制定针对性的专门政策,开展人工智能项目研究时必须吸收一定比例的数学家加入;三是更多的数学家要主动积极投身人工智能研究,将逻辑、思维等新的数学技术融入算法模型。

(本文系“交大评论”特约稿)

来源:人民邮电报