AI芯片“算力爆发”,产业应用如何布局突围?|WAIC观察

记者 | 彭新

AI产业火爆,AI芯片更是绝对的明星。

“芯片论坛异常火爆,已经有一千多人预约,但现场位置只有200个,主办方建议我们早点到现场。”在世界人工智能大会“AI智能芯片定义产业未来论坛”举办前,有厂商向界面新闻记者反馈。

作为AI产业的底层算力支撑,AI芯片成为绝对焦点。总体来看,以芯片驱动的人工智能和自动驾驶是展会重点,无论是大会展区还是产业论坛,都是参观者不时驻足观看、热切讨论的话题。

国产AI芯片加速追赶

在WAIC会场内外,AI芯片企业的存在感都颇为强烈,数家芯片公司在会展期间发布了AI芯片产品,登上世界舞台。

AI计算大致分为两个层面,首先是对模型进行训练(training),整个过程可能耗时数天;之后是训练出的模型响应实际请求,做出推理(inference)。目前,英伟达旗下的GPU(图形处理器)占据训练市场,多数推理任务则仍由传统的英特尔CPU承担。面向训练和推理场景,国产AI芯片厂商均推出了相关产品。

国内AI芯片初创企业燧原科技发布第二代人工智能训练产品——“邃思2.0”芯片、基于邃思2.0的“云燧T20”训练加速卡和“云燧T21”训练OAM模组,全面升级的“驭算TopsRider”软件平台以及全新的“云燧集群”,在WAIC展会会场,燧原科技展台颇受观众关注。

燧原科技的创始团队来自英伟达长期竞争对手AMD。公司创始人兼CEO赵立东曾担任紫光集团副总裁,更早前在AMD工作了7年时间,任计算事业部高级总监等,90年代在老牌显示芯片公司S3 Graphics任职。

“英特尔的芯片技术发展战略是Tick–Tock模式,Tick阶段升级工艺,Tock阶段升级处理器架构。对我们来说,我们第一代芯片是一个全新的架构,第二代我们有一个选项,架构保持大致不变,工艺向前演进,然后再架构再工艺,这就是沿着传统的Tick–tock这条路走。第一代芯片在落地过程和客户磨合过程当中,我们觉得架构的演进比工艺演进更重要。”赵立东称。

燧原科技外,天数智芯展示了国内第一款全自研、GPU架构下的7纳米制程云端训练芯片B1及GPGPU(通用计算GPU)产品卡。这颗芯片可容纳240亿晶体管及采用2.5D CoWos晶圆封装技术,支持FP32,FP16,BF16,INT8等多精度数据混合训练,支持片间互联,单芯片算力每秒147T@FP16。选择新款7纳米制程的原因在于,AI芯片对于制程要求较高,追求更先进芯片制造工艺也成为AI芯片厂商的重点。

推理芯片方面,登临科技展示了自主创新的GPGPU芯片,致力于解决通用性和高效率难题,在完整提供CUDA/OpenCL硬件加速能力的基础上,全面支持各类流行的人工智能网络框架和底层算子。

壁仞科技联合创始人张凌岚对近日对外界称,算力芯片是人工智能时代的发动机,相比西方几十年的积累,我国芯片制造行业仍处于起步阶段,据透露,壁仞科技明年将发布首款通用智能计算芯片产品。

不出意外,凭借在人工智能存在巨大优势的英伟达成为各厂商争先比较的对象。目前来看,AI芯片领域竞争激烈。目前GPU(图形处理器)厂商英伟达是市场上图形计算和AI计算上的领先者。

AI芯片新架构、产品层出不穷。服务器、云计算厂商对新型芯片选择持开放态度,浪潮AI&HPC总经理刘军曾告诉界面新闻称,AI芯片领域竞争非常激烈,公司数量非常多,包括在中国、美国、英国等,有一定的同质化。

芯片巨头发力AI各有“绝活”

主要芯片巨头,在会场上也公布了自己的AI应用方案。

苹果副总裁、大中华区董事总经理葛越在2021世界人工智能大会发言中,详细介绍了苹果芯片中的AI应用、架构和模式。

“苹果设计的芯片不是用来出售给其他公司,而是专门为苹果特定的产品,甚至是为了特定功能而专门设计的。这种优化贯穿于CPU、GPU、图像信号处理器及更多组件。”葛越称。

对于自研的坚持还体现在机器学习上,苹果的芯片中搭载了“神经网络引擎”。所谓“神经网络引擎(neural engine)”,是苹果在芯片中专门用于机器学习的硬件,可用于图像处理、人脸识别等。目前,iPhone12搭载的A14仿生芯片中的神经网络引擎能够完成每秒11万亿次的运算,是目前最强大的移动AI芯片之一。

葛越进一步介绍,M1芯片采用Arm架构设计,为5纳米制程,是当前电脑产品中制程最先进的芯片。该款芯片上共有160亿个晶体管,将中央处理器、图形处理器、神经网络引擎、各种连接功能以及其他众多组件集成在芯片上。

得益于此,M1芯片完成了看似不可能完成的任务:性能显著提升,包括将机器学习速度提升最高15倍,电池续航时间最高提升2倍。“苹果的芯片专为自家产品量身定制,并为机器学习进行了专门的优化。由于机器学习能够为用户提供更为独特的体验,因此,苹果早就开始研发能在设备端有效运行复杂机器学习算法的芯片。”

老牌芯片巨头英特尔,对人工智能也有自己的理解。“过去两年,我们发现有非常多的自主设备,非常多的数字化系统,需要用人工智能来处理。人工智能成为推动数字化转型的一大超级力量。” 英特尔研究院副总裁、英特尔中国研究院院长宋继强在WAIC会场上表示,他指出,从数据变化而言,处理海量数据只能依靠人工智能,而多元化数据形态也需要很多新的算法去梳理。

对此,英特尔认为,进入到新的时代,需要掌握更多不同的架构组合,以此满足专属特定领域的需求,因此架构创新是关键驱动力。”CPU适宜处理标量架构的,一个一个算,比如说控制流,非常容易去处理,可以去并发;GPU则适宜处理矢量运算,很多数据一起算;AI则更多是块状运算,需要专门做矩阵加速,数据的存取也需要优化;FPGA特别适合做一些稀疏的运算,可以大幅度降低I/O以及计算的消耗。这些把它整合起来就能各取所需,我们说常打组合拳会好过只用一种武器去解决所有问题。”宋继强向界面新闻记者解释。

高通在其移动芯片上集成AI功能有一定研究,高通中国区董事长孟樸介绍,在包括极速5G连接、高性能低功耗计算以及终端侧应用中,AI技术正在驱动新一代智能边缘终端和云计算的发展,万物能够实时连接至云端,让终端、体验和数据受益于不断增加的内容、处理能力和云端存储空间。

孟樸解释,为了实现AI的规模化,首先需要确保智能广泛分布于整个网络。业界预测,2020年至2026年,月度移动数据流量将增长500%以上,数十亿全新联网终端和事物将分布于边缘侧。有效应对数据的快速增长,需要的不仅仅是将数据传输至云端,还需要在终端侧集成AI能力,直接运行算法,为云端智能提供有力补充。

而终端侧AI具备多项关键优势,包括更高的即时性、可靠性和安全性。这些优势对于时延敏感和关键业务型应用至关重要,如自动驾驶汽车、智能电网和联网基础设施等。

“智能边缘终端产生的内容丰富的数据能够实时共享至云端,使AI得以充分发挥作用,并实现从云端到边缘侧的AI规模化应用。如今,AI几乎融入智能手机体验的方方面面,从影像到语音识别和安全,很快AI还将带来包括高度个性化、互动性和情境相关性的体验。”孟樸称。

场景成为AI芯片发力点

若AI芯片没有落地场景,就可能是空谈,面向场景和实际需求成为许多AI芯片厂商的宣传重点。

例如,寒武纪创始人兼CEO陈天石就在WAIC上预告了寒武纪正在设计中的车载智能芯片,称“拥有超过200TOPS的算力,采用7nm制程,具备车规级标准和独立安全岛,并将继承寒武纪云边端一体化的统一软件工具链。”

寒武纪是中国第一个推出云端智能芯片的创业公司,有云端训练芯片思元290和推理芯片思元270,以及用于边缘计算的思元220芯片的完整产品线。“到今天寒武纪已经形成覆盖了云、边、端三个领域,包括训练、推理等相对全面的不同品类的AI芯片,目前寒武纪产品线的特点就是‘云边端一体’,”陈天石表示。

目前,地平线车规级芯片征程3目前销售超过4.5万片,预计全年销售超过20万片,主要用于理想One等车型。而作为征程3的升级版地平线征程5芯片于今年5月点亮,面向L4高等级自动驾驶。

自动驾驶以外,面向智能安防、工业视觉、车载视觉场景的AI芯片成为热门。在WAIC期间,酷芯微电子发布新款高清AI相机芯片AR9341,酷芯微电子创始人沈泊在发布会称,该芯片集成了酷芯自研的深度学习处理器(NPU),具有4TOPS(相当于每秒进行4万亿次)峰值算力,架构优化后实际算力可等效于竞品的8-10TOPS。

作为中高端相机芯片产品,AR9341芯片目标应用领域包括高端智能IPC、车载辅助驾驶、边缘计算盒子以及智能机器人等,其工程样片预计将在今年9月份提供,量产时间为今年12月。

但并非所有人对此类芯片保持乐观态度,尤其是面向特定细分场景的AI芯片。此类实际上是牺牲通用性来换取AI等特定任务上更高的效率。有行业人士认为,市场上的AI芯片非常突出的一个问题,就是产品的通用性不足,目前唯一真正通用的还是GPU。他相信AI芯片会是百花齐放的局面,在不同领域会有新产品出现。

对此,中国电子技术标准化研究院集成电路测评中心主任任翔提醒,在AI芯片产业向上发展的同时也面临诸多挑战:首先,AI芯片面临更加广泛以及多样化的需求,AI芯片产业生态化需求日趋明显;同时,面向不同场景时,AI芯片的利用率、兼容性等有待提高,各类基于不同AI芯片的异构设备协同困难。

原创文章,作者:科技网,如若转载,请注明出处:https://www.40law.com/40law/7193.html

发表评论

邮箱地址不会被公开。 必填项已用*标注