如今智能驾驶领域方案呈现出两个不同的路线,其中一条路线是小米、小鹏、理想等车企在英伟达、地平线提供的芯片方案进行自研大模型优化,在主流芯片基础上实现软件功能的创新。小米在今天也在发布会上宣布使用双英伟达Orin-X方案,使用自研智驾芯片方案的车企仅有特斯拉和华为,这也凸显了自研智驾芯片的研发难度。
但蔚来在近期NIODay活动中发布首款自研智驾芯片神玑芯片,也加入倒自研智驾芯片阵营。这款新的自研芯片目标为1颗芯片取代现有蔚来使用的4颗英伟达Orin-X方案,AI性能、ISP性能都有了明显的提升,最小提升幅度都达到了4倍于Orin-X的水平。由于首款搭载神玑芯片车型为2025年交付的蔚来ET9,也宣告了蔚来即将开始使用自研智驾芯片的时间点。而神玑芯片能够为蔚来旗下车型带来怎样的体验收益,以及这款芯片能否在后年继续保持领先,是大家比较关注的点。芯片架构大更新,单芯片解决多芯带宽限制
在近日的蔚来NIODay活动中,蔚来发布了代号为神玑NX9031的自研智驾芯片,这款芯片被李斌评价为“用1颗实现4颗旗舰智驾芯片性能”的全新产品。神玑NX9031芯片是业界首次采用5纳米车规工艺制造的芯片,这款芯片将被用于替代现有的蔚来ADAM超算平台,甚至需要拥有与英伟达Thor芯片打得有来有回的计算能力。
李斌在发布会上表示,蔚来神玑芯片在BEV类算法性能拥有4.3倍提升,LiDAR类算法性能提升4倍,Transformer类算法性能提升6.5倍。这些性能提升得益于神玑芯片采用了全新的芯片设计,采用了CPU+ISP+NPU的架构模式,与英伟达Orin系列芯片的核心架构完全不同,神玑芯片明显更符合AI人工智能计算环境,这也是其智驾性能提升的关键。
现有算力最强的英伟达Orin-X芯片在核心架构设计方面采用CPU+GPU+ACCEL架构,与传统PC的架构设计逻辑类似,通过GPU的高算力打通AI计算,借用DLA深度学习加速器模块提升算力,芯片内部的主要算力释放由GPU负责、ACCEL中各功能模块进行辅助补全。
神玑芯片的架构设计以CPU+ISP+NPU为主要结构,其中ISP负责像素处理、功能类似于Orin-X上的GPU模块,NPU则专门负责AI相关的神经网络算力加速。NPU的工作原理为在电路层模拟人类神经元和突触,利用深度学习指令直接处理指令,以往需要CPU、GPU处理数千条指令完成的神经元处理,NPU只要一条或几条就能完成。因此,NPU的优势在于拥有更高的数据处理效率,这点是以GPU为主的智驾芯片所无法达到的。并且神玑芯片在Transformer算法方面也加入了专门的加速单元,NPU的性能释放更加符合现在主流算法的性能需求,无需专门的算法编译就可以直接加速。
而在CPU模块,蔚来将大小核设计加入到CPU中,相对于Orin-X也是一个大的创新。从CPU设计图可以直观看出,蔚来神玑芯片的CPU模块由2个Die互联,每个Die包含4颗大核与4颗小核,所有数据由中间的高速缓存输送至ISP、NPU模块。大小核设计的优势在于能够增加多核心并发处理速度,大核负责感知等高性能计算,小核则负责触控、座舱等性能需求较低的场景。根据蔚来放出的设计图,可以看出每个Die都有相同数量的大核与小核,从而减少任务调度带来的处理延时,神玑芯片的CPU工作效率要比Orin-X来得更好。