華為AI戰略完整披露!2款AI晶元首次曝光,拳打TPU,爭鋒英偉達

今天之後,再有人說華為沒有AI,可能徐直軍就要不高興了。為了AI,華為連集團的願景都變了。

去年年底,華為確定的新願景和使命:萬物互聯的智能世界,為了智突出智能,還將這次大會的主題定為「+智能,見未來」。

大會的前20分鐘,徐直軍就講了一個道理:AI太重要了。

作為一種通用技術,人工智慧對未來的影響和價值不容小覷,也是構築未來競爭力的關鍵,徐直軍說。「AI人才與需求之間,連1%都滿足不了。」徐直軍說,非凡和冷靜之間,是巨大的落差。

在現場,徐直軍首次公布了華為的AI戰略:

  • 投資基礎研究:實現安全可信、自動自製的機器學習基礎能力
  • 打造全棧方案:打造面向雲、邊緣和端等全場景、獨立及協同的全棧解決方案、提供充裕的、經濟的算力資源,簡單易用,高效率,全流程的AI平台
  • 投資開放生態和人才培養,面向全球夥伴合作,打造開放生態,培養人才
  • 解決方案增強:把AI思維和技術引入現有產品和服務
  • 內部效率提升:利用AI優化整個內部管理

全棧全場景AI解決方案

接下來,徐直軍發布了華為全棧全場景AI解決方案,這一方案將數據獲取、訓練、部署等各個環節囊括在自己的框架之內,主要目的是提升效率,讓AI應用開發更加容易和便捷。

全場景包括:消費終端 (Consumer Device)、公有雲 (Public Cloud) 、私有雲 (Private Cloud)、邊緣計算 (Edge Computing)、IoT行業終端 (Industrial IoT Device) 這5大類場景。

重點在於全棧,包含四個部分

一是Ascend (昇騰) ,AI IP和晶元,皆是基於達芬奇架構。晶元分為5個系列,Max、Lite、Mini、Tiny、Nano。

二是CANN,全稱為Compute Architecture for Neural Networks (為神經網路定製的計算架構) ,是高度自動化的運算元開發工具

根據官方數據,CANN可以3倍提升開發效率。除了效率之外,也兼顧運算元性能,以適應學術和行業應用的迅猛發展。

三是MindSpore架構,友好地將訓練和推理統一起來,集成了各類主流框架 (獨立的和協同的) :

包括TensorFlow、PyTorch、PaddlePaddle、Keras、ONNX、Caffe、Caffe 2、MXNet等等。

這一架構全面適應了場景。

四是ModelArts,這是一個機器學習PaaS (平台即服務) ,提供全流程服務、分層分級API,以及預集成方案。用於滿足不同開發者的不同需求,促進AI的應用。

此前,華為曾經發布了面向政府、企業的華為雲EI,以及面向智能終端的HiAI這兩套解決方案。而今天發布的全棧全場景AI解決方案,將為兩者提供更加完善的支持。

昇騰910:計算密度最大的單晶元

在「達芬奇計劃」中預熱已久的華為自研雲端晶元,現在終於暴露在聚光燈之下了。

徐直軍說:「外界一直在傳華為在研發AI晶元,今天我要告訴大家:這是事實!」

這款屬於Max系列的昇騰910,被徐直軍稱為是「計算密度最大的單晶元」,採用7nm工藝製程,最大功耗為350W。

昇騰910具體的性能數據很強,半精度為(FP 16):256 Tera FLOPS,整數精度(INT 8):512 Tera FLOPS,128通道 全高清 視頻解碼器- H.264/265。

晶元的性能怎麼樣?華為和友商對比了一下。這場battle的參賽選手包括谷歌TPU v2、谷歌TPU v3、英偉達 V100和華為的昇騰910。

「可以達到256個T,比英偉達 V100還要高出1倍!」

若是集齊1024個昇騰910,會發生什麼場景呢?徐直軍表示,會出現「迄今為止全球最大的AI計算集群,性能達到256個P,不管多麼複雜的模型都能輕鬆訓練。」

這個大規模分散式訓練系統,名為「Ascend Cluster」。

不過,說了這麼多,昇騰910廬山真面目到底長什麼樣?徐直軍表示910的面市時間是明年的第二季度,在華為雲上推出。所以要想一覽花容,還得明年見了。

不知道英偉達聽了慌不慌。

昇騰310:極致高效計算低功耗AI SoC

以為部署在伺服器端的910就是華為大招的全部?Naive,徐直軍這次帶來的,還有一張部署在邊緣設備的晶元。

「這是一款極致高效計算低功耗的AI SoC。」徐直軍這樣說,從西服里掏出來一個晶元。

邊緣端的昇騰系列成員不少,按照功耗由小到大排列,這四款晶元型號分別為Nano、Tiny、Lite和Mini。一口氣找來四個英文中描述「小」和「輕」的單詞來命名昇騰系列,華為在取名上還是下了不少心思。

其中,Nano、Tiny、Lite三款型號今天都……沒有到場,徐直軍表示它們2019年才能出來亮相。唯一來到現場的Mini仍然採用了達芬奇架構,半精度為8 TeraFLOPS,整數精度為16TeraFLOPS,擁有16通道全高清視頻解碼器,最大功耗為8W。

相比昇騰910,邊緣系列的昇騰晶元用武之地要親民得多,智能手機、智能附件、智能手錶等邊緣設備,都是邊緣系列的昇騰晶元的容身之所。後續,華為還將推出一系列AI產品。

OMT:華為朋友圈

之前,早有傳聞稱微軟將採用華為最新推出的AI晶元。今天,微軟全球資深副總裁、微軟亞太研發集團主席洪小文現身大會現場~

歡迎大家關注我們的專欄:量子位 - 知乎專欄

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。

量子位 QbitAI· 頭條號簽約作者

?? ? 追蹤AI技術和產品新動態