AI芯片的战役正愈演愈烈。

  7月11日,英特尔面向中国市场推出了AI芯片Habana Gaudi 2,Gaudi 2直接对标英伟达GPU的100系列,欲争夺AI算力市场的宝座。

  众所周知,目前GPU***紧缺,英伟达的100系列在国内禁售,而百模大战之下算力的需求还在飙升。对于中国市场而言,当前急需AI芯片“解渴”,对于英特尔而言,眼下正值算力紧缺的窗口期,也是进攻的绝佳时机。

  英特尔也强调,Gaudi 2芯片是专为训练大语言模型而构建,***用7纳米制程,有24个张量处理器核心。事实上,去年英特尔就已经在海外发布了Gaudi 2,此次在中国推出的是“中国***版”。

  由于各国的出口管制限制,外界首要关心的是AI芯片在中国市场的供应可持续性。对此,英特尔公司执行副总裁、数据中心与人工智能事业部总经理Sandra Rivera在接受21世纪经济报道记者***访时做出了肯定的回答。

  Sandra Rivera说道:“这张卡也是中国定制版的产品,对于出口或者是支持中国的客户是没有任何问题的。英特尔肯定是合法合规地在中国继续支持我们的客户,不管是Gaudi 2或者是未来的Gaudi 3,我们一定是在合法合规的情况下做出一些中国定制的产品,以满足中国的客户的需求。”

  同时,芯片的性能并没有打折,她表示:“在网络速度上,(中国版)和国际版相比,是从24个网口变成21个网口,但是整体性能还是基本一致的。”

  随着大模型的日新月异,英特尔在近几个月内围绕着Gaudi2继续进行优化。

  Sandra Rivera介绍道,在性能上,根据机器学习与人工智能开放产业联盟MLCommons在6月底公布的AI性能基准测试MLPerf Training 3.0结果显示,Gaudi 2是除了英伟达产品外,唯一能把MLPerf GPT 3.0模型跑起来的芯片。

  在发布会现场,英特尔也直接将Gaudi2和英伟达的A100进行比较,其野心可见一斑。根据英特尔公布的数据,从计算机视觉模型训练到1760亿参数的BLOOMZ推理,Gaudi 2每瓦性能约A100的2倍,模型训练和部署的功耗降低约一半。

  同时,英特尔高管还介绍道,目前相比A100,Gaudi 2价格更有竞争力,且性能更高。接下来到9月,***用FP8软件的Gaudi 2预计能够提供比H100更高的性价比。

  整体而言,除了芯片,在此次发布会上,英特尔展示了一系列支持大模型的算力解决体系,接下来具体的落地应用和产品迭代状况也受到关注。

  一方面,目前在中国市场上,英特尔已经和浪潮信息、新华三、超聚变等国内主要的服务器厂商合作,其中,浪潮信息的NF5698G7是专为面向生成式AI市场的新款AI服务器,支持8颗OAM高速互联的Gaudi2加速器,而在终端客户方面,Sandra Rivera表示:“中国市场对人工智能解决方案的需求非常强劲,我们正在与几乎所有传统客户洽谈。我们的云服务提供商、通信服务提供商都是企业客户,因此对人工智能解决方案有着强烈的需求。”

  另一方面,在产品路线上,英特尔近年一直强调XPU,即多样化、多组合的异构计算。在AI相关的产品线上,既有集成AI加速器的CPU处理器、有GPU产品,以及Habana Gaudi系列代表的ASIC类型AI芯片。

  Habana Labs成立于2016年,主要研发方向为人工智能、深度学习计算等,创业初期就得到了英特尔的投资,而后在2019年12月以20亿美元被其正式收购。

  对于GPU和AI芯片的组合,Sandra Rivera透露:“Gaudi是一个人工智能加速的专属产品,在英特尔产品里,如果是针对大模型这个工作负载,它是性能最佳、最优的一个产品。明年我们还会有下一代产品Gaudi 3发布。在2025年的时候,我们会把Gaudi的AI芯片跟GPU路线图合二为一,推出一个更整合的GPU的产品。”

  大模型的火热还在持续拉动AI芯片的需求。

  Sandra Rivera告诉21世纪经济报道记者:“在4月份回顾一季度的情况时,我们看到了各种人工智能带来的芯片需求,包括Gaudi在内,需求至少翻了两倍以上。”

  TrendForce集邦咨询向21世纪经济报道记者提供的数据显示,目前主要由搭载NVIDIA A100、H100、AMD MI300,以及大型CSP业者如Google、AWS等自主研发ASIC的AI服务器成长需求较为强劲,2023年AI服务器出货量(包含搭载GPU、FPGA、ASIC等)出货量预估近120万台,年增率近38%,AI芯片出货量同步看涨,可望成长突破五成。

  芯片厂商们也在AI领域开足马力。英伟达不必多言,当前不论是100系列还是800系列,都十分紧缺,在AI芯片市场上占据先发优势;在6月中旬,AMD推出了新一代AI芯片、数据中心CPU以及DPU,其中AI芯片Instinct MI 300X,直接对标英伟达H100;此外,谷歌、亚马逊、百度等大厂也都在自研AI芯片,在算力市场上的竞争维度更加丰富。

  而除了硬件之外,软件也同样关键。比如,目前大部分AI芯片都绕不开英伟达的CUDA平台,CUDA建立了一套软硬件间的开发标准。如何从CUDA迁移、如何建立自己的优势生态都是挑战者的重要课题。

  对于软件生态的竞争,Sandra Rivera表示:“软件开发或者是开发者生态,其实是英特尔多年的一个强项,在整个数据中心领域的软件生态中,一个是x86的软件生态,另外一个是CUDA。而且我们注意到,随着越来越多的公司希望使用人工智能,软件生态系统也正在加速挖掘更多硬件潜能,以大幅提高生产力。”

  她进一步谈道:“英特尔希望能在多种语言环境中,能够提供更简便的应用。通过软件、库和工具提供一种模块化的方法,来优化并加速跨多种架构的异构负载。当然在人工智能或者是AI运算的时候,确实很多人在用CUDA,但是大部分开发者不会做那么底层的开发,他们是在一个比较高的框架,比如说在PyTorch、TensorFlow上面去创新。”

  Habana Labs首席运营官Eitan Medina进一步向21世纪经济报道记者指出:“在Gaudi2之前,我们已经有一代产品,在软件上也做了好几年的积累,底层的软件库都已经开发好了,我们希望让开发者能够在最上层的20%的比例能够做他的开发,这里的开发和CUDA并没有那么直接的关联。”

  Gaudi系列作为英特尔AI的一艘旗舰,外界也拭目以待Gaudi 2在实际应用中的性能表现、算力实力。从硬件迭代到软件生态,AI芯片的竞争故事还将继续。