但从目前建设速度来看,这个目标可能会提前实现。新增算力设施中,智能算力占比过半。仍以中国电信为例,根据2023年半年度业绩报告,截至6月底,中国电信智算规模达到4.7EFLOPS,增幅62%,通用算力达到3.7EFLOPS,增幅19%,如今,仅仅8个月过去,智算规模翻了一番还多。
国产算力将多点开花
在这由央企建设智算中心引发的新基建浪潮中,华为将是最大赢家,尤其是具有国资背景的智算中心,中标候选人多以华为生态链企业为主,而英伟达在美国新一轮禁售后推出的“低配版”H20,则很可能失去这块市场。
从性价比来看,H20和华为昇腾各有优势。
两者价格几乎相当,上述服务器厂商人士透露,一台八卡H20国产服务器预计价格在100万元到140万元之间,而按照中国移动此次招标(11标包)中的356台特定场景AI训练服务器(扣卡液冷)共4.9亿元折算,一台价格为137.9万元,中标方为河南昆仑技术有限公司和四川华鲲振宇智能科技有限责任公司。记者从官方网站上查询到,这两家公司均为华为鲲鹏+昇腾的生态企业。
从算力指标来看,昇腾910B单卡算力为376TFLOPs,高于英伟达H20的296TFLOPs,但H20的卡间运行速度为4.0 TB/s,远高于910B的392GB/s,这被认为有利于更大规模的大模型迭代计算,比如万卡以上的集群训练。
据《IT时报》记者了解,搭载英伟达H20的国产服务器已经在与国内头部客户做匹配测试,但从产业链不同环节传来的声音却不尽相同。
一位国内头部服务器厂商人士告诉记者,从测试结果来看,英伟达的生态优势依然明显,预计H20正式供货之后,需求可能会比较密集。
但另一位智算中心负责人表示,H20性价比不高,他们暂时还不准备订货,准备等其他客户第一批H20服务器到货后,再观望一段时间,接下来投资重点肯定要放在国产算力上面,“现在我们已经与国内10家GPU厂商做对接和测试,今年准备按需采购,并且已经预留了相应的机房空间。”
除了昇腾,目前国内主流的AI算力芯片厂商包括曙光、寒武纪、燧原、沐曦等,北京、上海等地均已出台推动国产人工智能芯片突破的政策。上述人士认为,出于安全考虑,今年这些“非华为系”国产算力芯片产业将有望取得实质性产能和市场进展,作为Plan B(备选方案)在各地智算中心建设中多点开花。
商业模式尚待成熟
然而,上述服务器厂商高层也向《IT时报》表达了对智算中心建设潮的担忧,“实际上,智算中心现在要回答一个问题,如何盈利?”这个问题在此前并没有得到答案。
国家信息中心信息化和产业发展部主任单志广曾在接受媒体采访时提到,目前产业对智算中心的概念、运营模式、盈利模式的认识还不到位,导致部分项目收费模式不科学、对应用的支撑作用不大。
此前各地建设的智算中心,大多算力规模不大,主要用于城市治理,以传统视觉识别为主要AI应用,政府部门是主要客户群。但当人工智能发展到大模型,甚至多模态大模型时代,对于算力的需求呈量级增长,这些智算中心的能力必须更新升级,但建设资金所需巨大,来源则非常多元。
以前文所提哈尔滨的两个智算中心为例,哈尔滨数字龙江智算中心的招标人为哈尔滨市道外区金融服务和节能监测中心,建设资金来源为专项债券资金及政府资金,而哈投智算中心招标人为当地城投集团——哈尔滨投资集团有限责任公司。
上述专业人士表示,目前地方智算中心距离商业化还有一段路要走。此前也有不少地方智算中心表示,机架实际利用率并不理想。
此外,智算中心以出租或售卖算力为主。但各地同等规模项目的算力价格相差巨大,产业也未对算力进行价格上的标准协定。
一家智算中心产品经理告诉《IT时报》记者,目前智算产品定价并没有可参考的体系,尤其是国产算力产品,由于处于建设初期,生态还不完善,定价暂时与A800对标,但市场还需要一定时间和实践才能接受。
然而,2月15日Sora的发布,进一步加剧了“算力焦虑”。一位大模型专家测算,Sora的训练算力需求是大语言模型的上百倍。同时,推理阶段的算力需求也将大幅提升,上述专家测算,Sora一次推理任务的数据量可达到大语言模型的数十万倍,由此产生的推理算力需求是大语言模型的成百甚至上千倍。
当AI进入通用人工智能的快速通道,大规模算力集群成为必需品,但在美国的掣肘之下,算力建设更需要合理布局。
2月29日,据澎湃新闻报道,致公党中央拟向全国政协十四届二次会议提交《关于科学布局算力基础设施,精准赋能人工智能产业发展的提案》,其中提到,在加强智算中心建设同时,推进智能算力的标准化和不同厂商设备的互联互通。同时,加速淘汰落后算力产能,淘汰一批老旧的数据中心、改造一批高能耗低效率的数据中心、转变一批传统租赁服务模式的数据中心、关停一批企业自建数据中心。