ARM发布全新Ethos NPU与寒武纪、华为的NPU相比,哪个更强?

2019年10月28日 作者:Teardown

ARM市场营销副总裁Ian Smythe在ARM技术峰会上正式发布了全新的Ethos系列NPU IP,包括针对高端市场的Ethos-N77、针对主流市场的Ethos-N57和低端市场的Ethos-N37。

Ethos-N77实际上就是ARM去年公布的Project Trillium项目中的那款机器学习处理器IP,其内部集成了可配置的1-4MB的SRAM,在1GHz主频下,7nm工艺下,可以提供最高4 TOPS的AI算力,每瓦性能高达5 TOP。另外,之前Proj

m项目公布的数据显示,Ethos-N77的单位面积算力为4.6 TOPs/mm?(最新发布的可能有进一步提升)。

那么Ethos-N77的这个性能在市场上处于什么水平呢?

根据资料显示,华为麒麟970 NPU是基于寒武纪1A IP,算力是1.92TOPS。而苹果A11的NPU算力仅为 TOPS,A12的NPU性能为5TOPS。而根据此前高通骁龙855发布之时的数据显示,其整体(包括CPU+GPU+DSP等)的AI算力(超过7 TOPS)是华为麒麟980的两倍,照此估算的话,0.6麒麟980的NPU性能大概在3.5 TOPS左右。

另外据了解,华为麒麟980的NPU是基于寒武纪IH8,是针对低功耗场景视觉领域的NPU内核IP,而寒武纪IH8有 4 种可选的配置1T、2T、4T、8T [email protected],麒麟980应该是4TOPS的版本。而麒麟990系列的NPU并未公布具体的OPS数据,不过其采用了全新的达芬奇架构以及两个大核+一个小核的配置,性能应该更强。

在单位面积的算力方面,根据芯智讯此前的估算,麒麟970的NPU的单位面积性能大概是1.48 TOPs/mm2,而麒麟980和990没有相应数据可以参考。而根据TechInsights的拆解,苹果A12的NPU内核的面积为5.79mm2,也就是说苹果A12的NPU的单位面积算力约为0.86TOPS/mm2。

在每瓦算力方面,华为公布的资料显示,麒麟810的每瓦算力可以达到6TOPS。苹果的NPU未有相应数据。寒武纪新的NPU内核1M在7nm下每瓦性能为5TOPS。

从上面的数据对比来看,Ethos-N77的AI性能与苹果A12和麒麟980的NPU相当,相比麒麟990系列的NPU性能可能要弱一些。在单位面积算力方面,远高于苹果A12和麒麟970的NPU。在每瓦算力方面,也是远高于苹果A12的NPU,略低于麒麟810。

综合来看,ARM Ethos-N77各方面都还是比较出色的,达到了目前旗舰级NPU的水准。

需要指出的是,4 TOPS的性能是单个Ethos-N77核心在1GHz主频下的性能,如果配置双核的话,那么性能无疑将进一步提升,当然功耗和面积会进一步提升。

ARM此前就表示,Ethos系列IP是具有高可扩展性、兼容性和可编程的,可以提供计算性能最低从2 GOPS到超过70 TOPS的产品。

另外,ARM还推出了针对主流市场的Ethos-N57,内置了512KB SRAM,在1GHz主频下,算力最高可达2TOPS;而针对低端市场的Ethos-N37,是为了提供面积最小的ML推论处理器(小于1mm?)而设计,其同样也内置了512KB SRAM,在1GHz主频下,算力可达1TOPS。

ARM表示,Ethos-N57和Ethos-N37针对Int8与Int16数据类型的支持性进行了优化,通过如创新的Winograd技术的落地,使性能比同类NPU提升超过200%,并且配备了先进的数据管理技术,以减少数据的移动与相关的耗电,在ML在性能与成本、面积、带宽与电池寿命之间达成了比较好的平衡。

相关文章

  • 三星止于Exynos 990,看起苹果,自研GPU是未来唯一出路

    智能手机行业经过几年的洗牌,SoC厂商只剩下几个:苹果、三星、华为、高通、联发科和紫光展锐。三星可能是其中最特殊的一个,它自研的手机芯片可自用,可外卖,也有自家的智能手机品牌,同时还有自己的晶圆代工厂来直接生产芯片。业内具备完整的产业链,可以自给自足,对外界依赖最低的大概就是他了。 随着本周E
    2019年11月06日
  • 三星对cpu失去兴趣,专注GPU研发可能开创新局面

    有消息称,三星将停止自研CPU核心,未来完全转向ARM公版架构。 在三星提交给美国德克萨斯州劳动委员会的文件中显示,奥斯汀半导体工厂研发部门计划于12月31日关门,并解聘该部门的290名员工,其他近3000名员工则不受影响。对此,发言人Michele Glaze证实了这一消息,并称此举是一个放
    2019年11月05日
  • 基于ARM的自主式移动机器人电路设计

    自主式移动机器人系统是指根据指令任务及环境信息进行自主路径规划,并且在任务执行过程中不断采集局部环境信息,做出决策,从而实现安全行驶并准确到达目标地点的智能系统。本文以LPC2119为控制核心,介绍了一种轮式移动机器人的设计方案。该机器人系统应用超声传感器、光敏传感器、碰撞传感器采集外部环境信息,采
    2019年11月01日
  • ARM用NPU、GPU、DPU三款IP重新定义芯片性能、功耗

    众所周知,手机市场的需求正在下降,用户的换机周期正在增长,一些评测机构也发现,各家旗舰手机的芯片在单核、多核的性能提升上也正在放缓,这是否意味着芯片的能效提升放缓?曾经表示以每年能效提升30%为目标的Arm却在上周一口气发布三款IP,向放缓说No。 从系统角度不断提升 对于每年能效提升3
    2019年10月30日
  • Arm位置摆得很正:不会对中国公司断供

    日前,在ARM技术峰会北京站上,ARM中国CEO吴雄昂表示,经过法务的合规调查,ARM v8以及未来的v9架构源于英国,可以继续向所有中国客户开放授权。 这意味着,先前被ARM“断供”的华为公司将在芯片架构上继续获得ARM的支持。 总部位于英国的ARM是世界上最大的芯片公司之一。其本身并
    2019年10月29日
tracer ?? 抢庄牛牛下载