华为宣布开源CANN,对标英伟达CUDA

版主: Nimitz

回复
内容
作者
牛大春
栋梁
帖子: 19904
注册时间: 2023-12-21
Has thanked: 1062 time
Been thanked: 523 time

华为宣布开源CANN,对标英伟达CUDA

#1

#1 帖子 牛大春 »

  北京时间8月5日,在华为(专题)举办的昇腾计算产业发展峰会上,华为轮值董事长徐直军宣布,华为昇腾硬件使能CANN全面开源开放,Mind系列应用使能套件及工具链全面开源,支持用户自主的深度挖潜和自定义开发。
  CANN的全称是“神经网络异构计算架构”(Compute Architecture for Neural Networks),它的角色,是把上层AI训练框架(如PyTorch、TensorFlow、MindSpore等)和底层昇腾芯片连接起来的桥梁,让开发者不用关心芯片细节就能调用底层算力。
  几乎每一家算力卡公司都有类似的架构。最知名的是英伟达的CUDA和AMD的ROCm,在国内市场,有摩尔线程的MUSA、壁仞科技的BIRENSUPA、寒武纪的Neuware和海光信息的DTK等等。
  英伟达CUDA与GPU和NVlink构成英伟达的核心护城河,如今英伟达的计算卡之所以在全球热销,与CUDA软件系统生态的完善有着直接的关系。一旦用户想要从英伟达的计算卡体系迁移到其他品牌的体系中来,面临的问题是开发者必须重写大量代码,使用生态相对不成熟的替代库,同时也会失去英伟达围绕CUDA建立起来的庞大技术社区的支持。
  华为在7月底的WAIC上展示了昇腾384超节点真机,这座由12个计算柜+4个总线柜构成的庞然大物,它拥有300 Pflops的算力,269TB/s的网络带宽,1229TB/s的内存带宽。
  而随着今天华为正式宣布开源CANN架构,意味着未来所有的开发者可以更好的利用昇腾计算卡配合、CANN建立的计算生态和华为自研深度学习框架MindSpore,建立华为昇腾的AI软硬件一体化方案,以对标以英伟达为中心的PyTorch+CUDA。
  根据华为公开资料显示,CANN目前升级到8.0版本,新增200多个深度优化的基础算子、80多个融合算子、100多个Ascend C API,典型算子开发周期从2人月缩短至1.5人周,同时,支持图模式能力扩展库,提升PyTorch在昇腾上的大模型推理性能。
  截至目前,CANN已支持包括PyTorch、MindSpore、TensorFlow、飞桨、ONNX、计图、OpenCV和OpenMMLab等深度学习框架与第三方库。
  相比英伟达CUDA的闭源,此次CANN开源,华为无疑希望尽快通过开发者的合力共创,快速扩大CANN生态圈,让昇腾的计算卡不但在硬件上有计算能力,也要在软件上快速的弥补短板,真正意义上赶超英伟达。

 

POSTREACT(ions) SUMMARY

你们会在树叶掉光之前回家。

回复