继发布鸿蒙系统之后,华为再一次展示了其前沿 AI 领域的技术能力。
8月23日,采用华为自研达芬奇架构的 AI 处理器昇腾 910 (Ascend 910)宣布商用,与其一同面世的还有配套的全栈全场景 AI 计算框架 MindSpore。
实测结果显示,昇腾 910 的半精度 (FP16)算力达到 256 Tera-FLOPS,整数精度(NT8) 算力达到 512 Tera-OPS,且芯片最大功耗仅为 310W,比此前设计规格的 350W 更低。
用华为轮值董事长徐直军的话来说,昇腾 910 作为算力最强的 AI 处理器当之无愧。

算力即竞争力
昇腾 910 属于 Ascend-max 系列,是华为首款采用达芬奇架构的 AI 芯片,基于 7nm 增强版 EUV 工艺,其 AI 核集成了 3D 立方体计算引擎,可以在一个时钟周期内完成 4096 的乘加运算。
其实它的相关技术规格在去年 10 月的华为全联接大会上就已公布,彼时的半精度(FP16)256 TFLOPS 算力,相比英伟达的 V100 GPU 的 125 Tera FLOPS 还要高一倍。因此格外受外界关注。
为何要如此强调芯片算力?
目前华为已将昇腾 910 应用于实际的 AI 训练任务里。其中,在典型的 ResNet-50 网络训练中,昇腾 910 与 MindSpore 相配合,与现有主流训练单卡配合 TensorFlow 相比,性能提升近 2 倍。且每秒训练的图片数量从 965 张提升至 1802 张。
可以看到的是,随着数据和应用场景的不断增多,人工智能领域对于芯片的算力要求随之增加。来自第三方数据分析机构 OpenAI 近期数据表明,2012 年以来,人们对算力的需求增长六年超过 30 万倍,平均每 3.5 个月翻一倍,已经远超摩尔定律的发展速度——摩尔定律是每 18 个月翻一倍。

人工智能领域有三要素:数据、算法和算力。数据为芯片处理的对象,算法即计算的边界,而算力则直接决定了计算效率。对于华为来说,芯片是它们的硬实力,算力即它在 AI 领域的竞争力。
除了超高的算力之外,昇腾 910 还拥有高集成度和高速互联的特性。它集成了 CPU、DVPP 和任务管理器,因此它能独立完成 AI 训练流程。同时昇腾 910 集成了 HCCS、PCIe 和 RoCE 三种高速接口。其中最新的 PCle 吞吐量相比上一代翻了一倍。这些特性共同组成了算力最强的昇腾 910 处理器。
至于昇腾 910 的价格问题,徐直军并未直接透露,而是笑道:“具体定价还未定,但肯定比英伟达和谷歌低。”
除了全场景框架,还要生态
目前行业中已有 TensorFlow、Caffe 和 PyTorch 等主流 AI 框架,但它们都不支持全场景。这也是华为推出全栈全场景 AI 计算框架 MindSpore 的重要原因。

在去年华为全联接大会上,华为提出:AI 框架不仅应该开发态友好、运行态高效,还要能适应每一个场景。
而此次徐直军表示:能否大大降低AI应用开发的门槛,能否实现AI将无处不在,能否在任何场景下确保用户隐私得到尊重和保护,这些都与AI计算框架息息相关。
因此 MindSpore 框架有着针对性的提升:
不同运行环境下,MindSpore 框架架构可大可小 ,适应全场景不同资源预算独立部署;框架通过协同经过处理后的、不带有隐私信息的梯度、模型信息,而非数据本身,在保证用户隐私数据保护的前提下跨场景协同;将模型保护 Built-in 到 AI 框架中,模型安全可信。光有全场景的框架还不够,徐直军宣布要把 MindSpore 在 2020 年 Q1 开源,像英伟达一样建立自己的生态。
“生态很重要,MindSpore 框架的重点就是要建造和其他框架一样有生命力的生态。”徐直军在发布会现场表示。
AI 生态离不开开发者,为了让吸引并帮助开发者一同促进 AI 产业生态的发展。MindSpore 还实现了一个创新:AI 算法即代码,降低开发者的门槛,可以显著减少模型开发时间。
以一个NLP(自然语言处理)典型网络为例,相比其他框架,用 MindSpore 可降低核心代码量 20%,效率整体提升 50% 以上。
此外,徐直军表示华为拥有其它优势,如华为在智能终端上的 HiAI 引擎,可帮助开发者来开发基于终端产品的AI应用和服务;并且华为所拥有的算力优势,与计算框架所实现的能力是其它框架无法比拟的。
接受采访时,徐直军还提到,MindSpore 不仅支持昇腾处理器,它也支持GPU、CPU等其它处理器。
在 MindSpore 的背后,是华为 AI 全栈战略的野心。即从端到边缘再到云,先有了底层的硬件,再有一套深度学习的框架,最后到上层应用使能。

去年华为发布了 AI 全栈战略,而今天徐直军宣布全栈全场景 AI 解决方案已经完成了构建。这标志着华为 AI 战略进入了新阶段。
有经验,还有计划
尽管华为 AI 战略刚发布一年,但当时发布的另一款高效计算低功耗 AI 处理器昇腾 310 早已商用,并在多场景下得到了广泛的应用。
华为云为昇腾 310 提供了图像分析类服务、OCR 服务、视频智能分析服务等云服务。对外提供 API 达 50 多个,日均调用量超一亿次,预计年底日均调用量超 3 亿次。超过100多个客户使用昇腾 310 开发定制 AI 算法。
此外,华为还陆续发布了 Atlas 系列产品,被应用于安防、金融、医疗、汽车等行业,有摄像机、无人机、机器人、MDC(Mobile Data Center)等产品形态。目前已在智慧交通、智慧电力等数十个行业里有落地解决方案。
昇腾 310 产品的应用,对于接下来昇腾芯片家族产品有着重要参考意义,而昇腾 910 仅仅是一个开始。
徐直军表示,面向未来,华为将持续投资,继续推进全栈全场景的 AI 解决方案,针对不同的场景,如边缘计算、自动驾驶车载计算、训练等场景,推出更多 AI 芯片。包括昇腾 320、昇腾 920 等芯片。

值得一提的是,面向终端的昇腾 Tiny 系列会在即将发布的麒麟 990 上应用。
眼下 5G 虽然广受关注,但 AI 产业对于人类社会的发展意义更加重大。最近任正非签发的一封电邮里,他表示 5G 只是小儿科,人工智能才是大产业,才是华为发展的战略要地。