禁售阴影之下,国产GPGPU是否有望补齐缺口?
- 来源:C114通信网
- 时间:2023-08-17 16:08:15
今年年初,ChatGPT犹如一颗火种,激发了AI应用的发展动力,AI产业进入发展的快车道。国内的AI产业自然也乘势而起,仅半年光景国内就涌现出近百款AI大模型产品,由此进入“百模大战”的竞争格局。
(相关资料图)
训练大模型需要以算力为基础,全球AI公司对NVIDIA 芯片追捧至极,GPU有价无市。近期新闻,NVIDIA H100已无存货,就算现在订购,也要等2024年Q1甚至Q2才能用上。据传闻,百度、字节、阿里、腾讯等大型科技公司也向NVIDIA下了总计50亿美元的A800等芯片订单。
只不过有人企图对国内AI大模型发展加以干涉。美国《华尔街日报》透露,由于担心中国可能使用NVIDIA 和其他公司的人工智能芯片“进行武器开发和黑客攻击”,美国政府考虑加码计算芯片领域的制裁,限制NVIDIA公司向中国出口A800、H800芯片,一时间让处于快速发展中国AI产业,又一次笼罩于禁售阴影之下。
难以替代的GPGPU架构芯片
从美国对国内算力芯片的一而再,再而三地限制中,可以看到美国对中国AI产业发展的忌惮。近年来随着数字经济的蓬勃发展,国内在推进算力基础设施建设取得积极成效。据工信部统计,目前我国算力总规模居全球第二,保持30%左右的年增长率,而且新增算力设施中智能算力占比过半。这其中作为算力载体的AI计算芯片,其地位自然无比重要。
目前全球AI计算芯片主要分为GPGPU、ASIC、FPGA三种架构。而被限制的A800和H800芯片就属于GPGPU架构芯片。GPGPU架构也是AI加速芯片市场的主流,占据了90%的市场份额。
GPGPU从GPU发展而来,是GPU去掉图形处理能力,提升并行计算能力之后的产物。GPGPU是如何成为最适合AI计算的芯片呢?
对比CPU和GPU,结构上的差异决定了CPU和GPU功能上的区别。由于CPU在控制和存储的能力上比较强,因此能进行比较复杂的计算,不过可以同时执行的线程很少。而GPU则相反,大量的计算单元让它可以同时执行多线程的任务,但每一个任务都比较简单。
打个比方,如果CPU是一个懂高等数学的大学生,概率、微积分全都会做,但让他做一万道四则运算数学题,还是要花费大量的时间;而GPU好像是一万名只懂得四则运算的小学生,虽然不会函数、代数等高级知识,但是遇到一万道四则运算两秒就能做完。
在AI神经算法成熟后,业内发现GPU的功能特性很适合进行AI训练,因为在深度学习模型中,最主要的运算就是矩阵运算和卷积,而这些运算从根本上都可以分解为简单的加法和乘法。如此挖掘出了GPU在AI领域的应用空间。2007年,英伟达提出了GPGPU,即通用GPU架构,将原本专用于图形处理的GPU改造成了更适合AI运算的GPGPU。
其实AI计算芯片除了GPGPU架构,还有ASIC、FPGA等架构。只不过ASIC、FPGA芯片是结合某些计算场景需求的定制化产品,通用性不强。
GPGPU研发难度高,国产短板待补齐
在美国限制出口、国内大模型急需GPU或GPGPU的时候,国内真正能做GPGPU的厂家却很少。因为GPGPU芯片研发难度,比其他类型的AI芯片要高出很多。
有业内人士分析过,GPGPU 芯片的团队大概需要1000 人左右,至少也要做两年才能做出一颗芯片,这还只是推理芯片而已。如果要做大模型训推一体的大芯片,那么至少 3 年才能把一颗芯片做出来。这意味着,如果有国内厂商能赶上今年大模型风潮,至少需要从2020年就开始布局研发设计。
并且GPGPU研发出来之后,决定其性能发挥上下限的,不止是架构设计优劣、制造工艺先进与否等条件,还需要有软件生态支持,还需要售后团队结合大模型情况调优产品等等。
NVIDIA之所以能称霸AI芯片领域,在于其结合GPGPU架构开发了CUDA软件平台,允许开发者使用类C语言编写GPU的并行计算代码,并且提供了大量的库函数和工具来帮助优化GPU计算。NVIDIA运营CUDA已经十余年时间,软件生态才是NVIDIA真正的护城河。
国内AI芯片面对NVIDIA先发优势,如何把握住AI大模型带来的GPGPU黄金机遇?
国产GPGPU杀出几匹黑马
当前国内AI芯片主要厂商包括华为、寒武纪、海光信息、遂原、壁仞、天数智芯等,此外龙芯也在布局。其中,发力GPGPU芯片的包括海光、壁仞科技、龙芯等等。
海光GPGPU架构芯片深算一号在2018年启动研发,于去年发布。据了解,海光深算一号性能优异,对比NVIDIA A100及 AMD MI100发现,在典型应用场景下,深算一号指标已经达到国际上同类型高端产品的水平。并且深算一号最大亮点在于,支持全部计算精度,在国产GPGPU中具备唯一性。在生态方面,海光深算一号可兼容类CUDA环境,对于AI开发者无需复杂适配,即可迁移到海光平台。
如此以来,在禁售阴影下,海光GPGPU产品可作为国外芯片最好平替。据海光披露,截止今年GPGPU产品已量产商业化应用,规模达几十万片,应用领域涵盖互联网、能源等行业。
壁仞科技成立于2019年,在2022年发布了首款GPGPU芯片BR100系列,性能方面超越NVIDIA A100,今年发力目标为量产上市。但业内人士认为,对于国内初创GPGPU公司而言,软件生态更为重要。目前国内的初创公司虽然在细分领域上有一定的落地,而真正在大模型训练上能有实际应用的几乎没有。
而龙芯暂无产品发布,目前进展为已经完成相关IP的设计,正在验证优化过程中,第一个集成自研GPGPU核的SOC芯片计划于2024年Q1流片。从流片到量产,如果按最快6-12个月来算,龙芯的GPGPU产品至少也要在2024年Q3以后才能发布,量产估计需要在2025年了。
总体而言,国产GPGPU迈出从0到1的第一步是最主要的。禁售危机中蕴藏着机遇,哪怕作为后来者,在国内如此大的消费市场支撑下,也将有追赶上NVIDIA的可能。
关键词: