东数西算高楼渐起——全国算力一张网 东西协同一盘棋
  时间:2022-12-20

2022年可谓东数西算元年。2月,国家发展改革委等四部门批复同意京津冀地区、长三角地区、成渝地区、粤港澳大湾区启动建设全国一体化大数据中心国家算力枢纽节点。此前,四部门已批复同意在内蒙古、贵州、甘肃和宁夏等四个节点启动建设国家算力枢纽节点,并规划了10个国家数据中心集群。至此,全国一体化大数据中心体系完成总体布局设计,东数西算工程正式全面启动,开启了我国算力资源全国范围跨区域统筹布局的新篇章。

一、算力时代已来

算力通俗讲就是计算能力,是指对数据的处理能力。算力可用FLOPSFloating-point Operations Per Second,即每秒浮点运算次数)计量。算力存在于各种智能硬件设备,是推动人工智能、大数据、物联网、区块链等技术创新与应用的基础支撑。

1964年,我国自行独立设计的通用数字电子计算机119诞生,运算速度为每秒5万次。然而,面对大量科研计算任务,这台国内唯一可用的电子管计算机匀不出足够机时,来自全国各地的科研工作者需要排队等候才能使用。尽管后来上海华东计算技术研究所将119型计算机复制了一台(J501计算机),但作为第一代电子管计算机,性能极不稳定。中国氢弹之父、著名核物理学家于敏就曾率领研究人员利用华东计算技术研究所国庆节假日期间空出的全部机时集中突击,为了避免出错又不浪费机时,采用换人不停机的方式工作,以减少机时损失。

如今,抢机时时代已经过去,超级计算机的运算速度以每秒千万亿次计算。国防科技大学的银河、天河系列,中科院的曙光系列,联想的深腾系列,无锡江南计算技术研究所的神威系列共同构成了我国超算力量,助力众多科研领域取得丰硕成果。2022年上半年全球超级计算机500强榜单显示,在全球浮点运算性能最强的500台超级计算机中,中国部署的超级计算机数量达到173台,位列全球第一。

当前,我国算力总规模已超过140 EFLOPS,近5年年均增速超过30%,算力规模排名全球第二。数据中心是算力的主要提供形式,截至2021年底,我国在用数据中心机架总规模超过520万标准机架,平均上架率超过55%。扫地机器人、无人驾驶汽车、智能音箱……各种智能场景的背后都暗藏着计算的力量。随着数字产业化、产业数字化进程不断加快,数字经济飞速发展,数据总量也呈爆发式增长。数据作为与土地、劳动力、资本、技术等并列的生产要素,与之相关的存储、计算、传输、应用等算力需求都在大幅提升,预计每年仍将以20%以上的速度快速增长。算力,已经深入到数字经济时代的各个角落,成为国民经济发展的重要基础设施。

数字经济时代,算力已经成为衡量国家经济发展程度的重要指标。《2021-2022全球计算力指数评估报告》显示,国家计算力指数与GDP的走势呈现出了显著的正相关。从15个重点国家的计算力指数看,平均每提高1点,数字经济规模和GDP将分别增长3.5‰1.8‰,预计该趋势在2021—2025年将继续保持。

同时,算力已成为推动我国经济高质量发展的重要支撑。国家信息中心信息化和产业发展部主任单志广在接受《经济》杂志、经济网记者采访时表示,从技术融合看,人工智能、量子计算、类脑计算等新技术与计算产业相结合,拓展了全方位计算能力;从领域协同看,数据的泛在分布推动计算从云端向物联网、边缘计算逐步普及,随着5G带来低延时、高带宽和高连接密度的管道,云游戏、云VR、云桌面、云手机等新兴业务需求蓬勃发展;从行业渗透看,计算已经跨越IT产业本身,成为数字化基础设施,为制造业、汽车行业、智慧城市等多领域的数字化转型提供支撑。以算力为核心融合大数据、人工智能、物联网、区块链等新兴技术,并与智能制造、智慧城市、智慧医疗、智能交通等领域协同联动,将为数字中国建设和数字经济发展带来强劲动力。单志广表示。

而东数西算最重要的意义在于有利于促进碳中和、碳达峰目标的实现。纵观中国算力版图,东部占60%,西部占20%,东部远高于西部。而从算力资源的空间分布潜力来看,西部潜力远高于东部。建设数据中心需要大量土地、电力,东部资源日趋紧张,而西部土地广阔、电价便宜、能源尤其是绿色能源丰富,将数据中心建立在西部,不仅能够节约西电东送的成本,还能提高对西部光伏、风电等绿色能源的使用,助力双碳目标实现。

具体来看,国家为8个算力枢纽内10个数据中心集群划定了物理边界,并明确了绿色节能、上架率等发展目标。比如,集群内数据中心的平均上架率至少要达到65%以上,可再生能源使用率要有显著提升。据了解,2021年我国数据中心的PUE(电能使用效率)指标为1.49-1.5,整体处于较高水平。按照国家一体化数据中心建设要求,东部数据中心集群的PUE平均要求小于1.25,西部则要求小于1.2。未来,数据中心具有很大的节能减排空间。从能耗构成来看,服务器能耗占比约45%,供电损耗占比约10%,散热能耗占比约43%,未来随着供电和制冷技术不断优化,加上西部天然的气候和能源条件,这些都有利于减少碳排放。

二、筑牢三大基石

数据、算力、算法是支撑数字经济发展三个要素。单志广提到,当前从总体发展情况看,我国数据发展大而不优,算力发展结构不均,算法发展整体不强,需要根据我国国情实际,切实做好数字经济支撑要素固根基、补短板、强弱项、增优势,不断做强做优做大我国数字经济。

第一,数据发展大而不优数据是发展数字经济的关键要素。单志广介绍,我国是目前世界上数据总量仅次于美国的第二数据大国,到2025年中国数据总量预计将跃居世界第一。但是,由于各行业信息化水平不一,大数据技术建设和业务应用水平差异较大,导致数据质量特别是大数据质量总体上参差不齐,数据纯度不够、价值不高。同时,大数据产业链中存储环节总体上产能过剩,分析处理环节又欠缺失衡,导致数据通过清洗、加工、精化等提升数据质量的力度不够,影响数据治理的优化。另外,数据共享、数据开放进展缓慢、成效不彰,已成为数字政府、智慧城市和数字经济发展的瓶颈和制约。

第二,算力发展结构不均单志广表示,我国算力发展存在三多三少的结构性失衡。一是数据中心底层架构和服务能力存在结构性失衡,传统数据中心多、智能计算中心少。当前,我国数据中心以传统数据中心为主,通过虚拟化方式面向政府、企业和个人提供通用云计算服务,复杂计算能力不足。科技部主导建设了8个国家超级计算中心,通过超级计算节点互联方式面向海洋科学、油气勘探、气候气象、生物医药等前沿科学领域开展应用计算研究与服务,商业化服务门槛较高。但在人工智能普及应用以及算法模型参数量和复杂度不断提升的背景下,我国具有数据吞吐大、计算速度快、算法工具多、软硬件协同、服务价格适中等特征的智能计算中心则相对较少,难以满足产业数字化转型和智能化升级需求。二是数据中心区域分布和规模类型存在结构性失衡,东部多中西部少、中小型多大型少。从区域分布看,北京、广东、上海、浙江、江苏等经济发达省份人口及互联网用户密度大,互联网、云计算等科技创新类企业多,是我国数据中心业务需求最旺盛的区域,也是数据中心资源最为集中的地区,上架率达到60%-70%。从规模类型看,2019年我国数据中心数量大约有7.4万个,数据中心机架规模达到227万架,可对外服务的IDCInternet Data Center,互联网数据中心)数量为2213个,其中,中小型数据中心占比超过87%,超大型数据中心相对较少,整体上存在重复建设、利用不足、能耗较大等问题。三是数据中心核心芯片和软件产品存在结构性失衡,进口依赖多、国产自主少。硬件方面,服务器核心的数据处理、存储和传输等高端芯片国产化能力偏弱,供应链集中在欧美日韩台等国家和地区,以我国主流服务器芯片为例,国内企业主要基于AMD公司授权进行x86架构二次开发,难以掌握底层技术,存在较高的授权终止以及数据安全风险。软件方面,长期以来,我国软件应用市场由国外企业主导,在服务器操作系统、数据库、高性能计算基础软件等领域缺乏拥有核心竞争力的本土龙头骨干企业。此外,数据中心国产化软硬件兼容方面还需不断完善。

第三,算法发展整体不强算法已成为人工智能的基础。当前,数据和算力已经不再是人工智能发展的主要瓶颈,人工智能的创新主要就是算法的创新。在这样的背景下,只有不断探索新的算法机制,发展新的算法应用,开发新的算法模型,发掘和培养算法人才,才能为推动智能社会发展提供强劲动力。

单志广认为,在数字经济的三要素中,数据位于价值金字塔的底层,算力处于价值金字塔的中部,而算法处于价值金字塔的塔尖,它的价值含量最高,对数字经济发展的作用最为关键。因此,应该高度重视算法基础设施,实现算法基建化。算法基础设施会被部署在算力基础设施上,共同推动应用的发展。近年来我国算法发展进展很快,百度、腾讯、科大讯飞等深度学习的算法能力在多个领域达到国际先进水平,AI领域的明星创业公司如旷视科技、商汤科技等聚焦在深度学习最擅长的视觉识别和语音识别领域,推动中国相关领域的技术水平达到国际一流。但是,我国的算法发展仍然整体上竞争能力不强、人才储备不足、基础能力不够,迫切需要从整体上提升我国算法的国际竞争力和价值贡献度。单志广说。

三、最大挑战是摸清家底

简单说,东数西算就是把东部的数据拿到西部进行计算。其中,数据指的是以二进制方式可以存储处理的数字化信息,计算则代表我国丰富的算力资源。需要强调的是,全国一体化大数据中心是全局性的大概念,目前批复的8个国家枢纽节点和10个国家数据中心集群是构建全国一体化大数据中心的雏形,是开展全国范围内的布局和优化,而东数西算相对而言是小概念,并不能单独讨论。而建设全国一体化大数据中心,其中一个方面就是实现集群之间的算力调度。无论是全国一体化大数据中心布局还是东数西算建设,背后都是复杂的巨系统的优化调度问题。

东数西算带来的最大挑战就是摸清家底。在东数西算工程实施中,数据资产和算力资源都存在持续性和动态性,要求人们必须实时摸清当前处于活跃状态的、正在被处理的数据资产和运行中的算力资源,以及处于静态环境里的被保存的数据资产和储备算力资源,由此才能实现最优化的算力资源调配,使得各类数据资产能够得到最为及时的分析处置。这需要对各类相关算力资产(IT硬件资产、IT软件资产等)摸清家底,以便更精准地进行能源资源的消耗调配和预储备,真正做到心中有数

那么,这个大工程究竟应该如何布局?首先要对算力进行分类。算力分为三种类型,超算算力、智能算力和基础算力,与此相对应的是超级计算(HPC)、智能计算和大数据处理系统三种计算模式。近年来,我国算力结构随着应用需求的变化不断演化,基础算力占算力的比重由2016年的95%下降至2020年的57%,智能算力占算力的比重则由2016年的3%提升至202041%,超算算力在整体算力中的占比较为稳定,约为2%,主要用于科学计算与工程计算等领域。而东数西算工程目前是对超算算力和智能算力的调度和统筹,这是由于基础算力承载的多是电子游戏、短视频、即时通信等实时性较强的需求,就目前的技术而言,具有实时性的本地数据无法搬到异地计算,因此西部目前主要考虑的是承载后台加工、离线分析、存储备份等非实时算力需求。

即使对于能搬过去的计算机来说,一对一进行固定匹配而不是动态调度的可能性也较大。不同超级计算机的处理器、加速卡、框架等各不相同,算力基础设施面临异构化挑战。这需要搭建智能异构算力平台,突破异构算力适配、异构算力网络调度等关键技术,优化东西部各类算力资源的配比。

单志广认为,东数西算不是现在时,而是全国一体化大数据中心建设的将来时,是全国一体化大数据中心的一类高级应用模式。他进一步解释,全国一体化大数据中心理论上包括所有的AB算,AB可为东、西、南、北、中等各方位的任意排列组合,而东数西算只是其中一种情况。对于当前的现在时,只能叫东数西存,实时性数据仍然是东数东算”“西数西算。等到全国各个节点全部打通形成网络并且建立起成熟的调度系统和机制后,才能实现面向业务、面向服务质量(QoS,Quality of Service)、面向成本的优化调度,才是真正意义上实现了东数西算

单志广表示,全国一体化大数据中心体系和东数西算工程要发挥实效,至少要从以下三个方面进一步落细落实。第一,要做好国家规划布局的国家算力枢纽节点、国家数据中心集群与现有的全国各地各类型算力设施的统筹、衔接和配合,形成合理分工、科学联动、高效协作机制,切实发挥国家布局的引领和示范作用。第二,要在业务层面上做好供需匹配和精准对接,解决谁的东数由谁来西算’”这一问题。没有业务保障,算力设施就无法发挥应有作用,从而造成设施空置和能源空耗。这种供需匹配可能需要在国家层面、省市级层面、企业层面、业务层面等多层级开展面向性能、价格、效益等多方面的测算,形成真正的应用需求供给和可持续的长效动力机制。第三,最核心关键的是,要具备实现算力统筹和智能调度的算力网络,能够在全国范围内,根据动态业务需求,在云、网、边之间实现按需分配和灵活调度计算、存储、网络等资源。

我国算力交易平台也正处于探索发展阶段。6月,上海市通信管理局制定了《新型数据中心算力浦江行动计划(2022-2024年)》,力求通过构建以高性能算力为主的多元算力服务生态体系,依托上海新型互联网交换中心平台交换架构的独特性,先行先试,探索打造中国首个算力交易集中平台。未来,算力资源度量标准将会实现统一,算力资源按需购买、合理使用将成为现实,实现全国算力可调度、可交换,各方按需供给。

四、逐鹿算力经济

东数西算战略工程的实施,意味着围绕数据”“算力两大关键词的多维化、复合型产业生态集将会逐渐形成。能源行业、信息通信行业、互联网行业、运营商、工程建设行业领域里的相关企业将会是东数西算工程基础建设阶段的最早获益者。

东数西算工程带来的是用电量的激增。随着我国数据中心能源消耗的逐年攀升,电费支出约占数据中心年运营成本的95%。对于能源行业而言,控碳不控电是能源企业的终极目标。在为数据中心配置绿色电力上,国家电网有限公司中遵循资源禀赋原则。对于绿色电力资源丰富的地区,国家电网落实国家实施方案,积极推动利用清洁能源电力,保障数据中心供电;对于缺乏绿色电力资源的地区,国家电网也在现有绿电交易的基础上,扩大可再生能源市场化交易范围,鼓励数据中心企业参与可再生能源市场交易。在应对负荷增加上,国家电网各省(区市)公司通过推动负荷中心常规电源建设、提升跨区输电能力、优化区域主网架等各种措施,确保安全可靠供电。

东数西算工程中的数据中心是典型的关键信息基础设施。对于信息通信行业中的网络安全企业来说,东数西算工程会给数据资产安全性问题带来巨大挑战。华顺信安是一家主营网络安全业务的公司,该公司专家告诉《经济》杂志、经济网记者,未来数十年间,东部大数据将爆炸式地涌现,这必将加大数据资产的流动性、动态性和聚集性,也必然会使得数据资产面临来自网络空间里的各类恶意攻击。恶意攻击者将会狰狞地窃取、恶意销毁数据资产,甚至是去破坏对数据资产的算力支撑。因此,在东数西算工程的规划、建设甚至运维阶段,都要确保网络安全。

另外,东数西算工程让数据算力实现了具有规划性的深度融合,这意味着,数据蕴含的更多价值将会被挖掘发现,数据要素将会在数字经济建设过程中发挥出更大的作用。以数据为重要核心资源的新型高科技企业,会在东数西算工程加持下获得加速发展的良机。

而运营商的优势在于算力网络。算力网络是云网融合数字基础设施的特征和重要组成部分,电信运营商是算力网络建设的主力军。在20217月举行的国际电信联盟电信标准化部门(ITU-T)13研究组(SG13)报告人会议上,通过了由中国电信研究院网络技术研究所牵头的算力网络框架与架构标准(Y.2501),成为首项获得国际标准化组织通过的算力网络标准。

技术支撑是东数西算工程成功推进的核心。包括华为、腾讯、阿里等互联网企业已经在东数西算算力枢纽节点地区布局或投产了数据中心,为东数西算工程落地助力。过去一年多,随着鹏城云脑II和武汉人工智能计算中心的上线,华为逐渐参与各地人工智能计算中心的建设,腾讯在不同区域均部署了数据中心,以保证数据安全和稳定性。

当下,目之所及的算力经济可能只是未来发展前景的冰山一角。电力时代有电网,进入算力时代,也将有算网。可以想象,在实现基础性原始创新和大量技术攻关后,算力未来会飞入寻常百姓家。像用水、电一样,使用算力将更为简单、便捷。(薛新怡对本文亦有贡献)

(来源:《经济》杂志;作者: 翟晓汀 张军红)