當下這個階段,如果你的芯片沒有一個某某性能最強的標志,那么奉勸你不要來國產芯片發布的圈子湊熱鬧。現在,這里是“地表最強”芯片的舞臺。

 

 

8 月 23 日,華為在深圳總部推出 AI 處理器 Ascend 910(昇騰 910)。華為輪值董事長徐直軍表示,昇騰 910 總體技術表現超出預期,作為算力最強 AI 處理器,當之無愧。

 

圖片來源于華為官網

 

無獨有偶。9 月 25 日,杭州云棲大會上,達摩院院長張建鋒現場展示了最強的 AI 推理芯片含光 800。張建鋒表示,在業界標準的 ResNet-50 測試中,含光 800 推理性能達到 78563 IPS,比目前業界最好的 AI 芯片性能高 4 倍;能效比 500 IPS/W,是第二名的 3.3 倍。

 

看到這里,大家發現阿里、華為對于“最”字的應用是不是過于隨意了?這看起來更像是文字游戲,之后所有在某一領域拔尖的芯片都可以用這樣的方式冠以“地表最強”的稱號。

 

但我們無力反駁。昇騰 910 確實是目前算力最強的 AI 芯片,而含光 800 也確實是目前 AI 推理能夠力最強的芯片。

 

無論如何,昇騰 910 和含光 800 在中國芯片歷程上都有著自己突出的貢獻,在我們的芯片發展史也都會寫下濃墨重彩的一筆。

 

昇騰 910- 最快的訓練芯片


昇騰 910 搭載的是華為自研的達芬奇架構,達芬奇從 IP 到指令集都是華為自己的專家創造的,并且支持全場景人工智能應用。昇騰 910 的算力是國際頂尖 AI 芯片的 2 倍,相當 50 個當前最新最強的 CPU。因此,昇騰 910 的訓練速度比當前最新最強的芯片提升了 50%-100%。

 

昇騰 910 AI 處理器內置 32 個達芬奇 AI Core,基于臺積電 7nm 增強版 EUV 工藝。除了基于達芬奇架構的 AI 核外,昇騰 910 還集成了多個 CPU、DVPP 和任務調度器(Task Scheduler),因而具有自我管理能力,可以充分發揮其高算力的優勢。在算力方面,昇騰 910 芯片達到了設計規格(半精度(FP16)256Tera-FLOPS;整數精度(INT8)512Tera-OPS)。此外,昇騰 910 芯片達到規格算力所需功耗(310W)低于設計值(350W)。

 

在華為全聯接 2019 大會上,華為發布了全球最快 AI 訓練集群華為 Atlas 900。其就是基于數千顆昇騰 910 AI 處理器互聯構成,總算力達到 256P~1024P FLOPS @FP16,相當于 50 萬臺 PC 的計算能力。

 

圖片來源于華為官網

 

含光 800- 最強的推理芯片


含光 800 是一款云端 AI 推理芯片,峰值性能為 7.8 萬 IPS(每秒能處理 7.8 萬張照片),峰值能效達到 500IPS/W。據介紹,1 顆含光 800 的算力相當于 10 顆 GPU,目前基于含光 800 的 AI 云服務已在阿里云上線。

 

圖片來源于平頭哥官方宣傳圖

 

含光 800 不同于基于馮·諾依曼架構的傳統通用處理器,而是根據神經網絡推理運算特征,設計特定的硬件神經元、高速連接的存儲結構以及專用指令集,對內存和計算單元實現高效組織管理,實現單條指令完成多個操作,提高計算效率和內存訪問效率。

 

含光 800 在算法方面也得到了加強。阿里巴巴達摩院機器智能實驗室過去兩年構建了完整的算法體系,涵蓋語音智能、語言技術、機器視覺、決策智能等方向,并且取得多個世界領先水平的成果。

 

不管是訓練還是推理都需要強大的算力支撐,而兩塊芯片都表現了優異的性能。

 

經實測,昇騰 910 打造的 Atlas 900 可以在 60 秒完成基于 Resnet-50 模型訓練,比第 2 名快 15%。這可以讓研究人員更快的進行圖像、語音的 AI 模型訓練,讓人類更高效的探索宇宙奧秘、預測天氣、勘探石油,加速自動駕駛的商用進程。在一張匯聚有 20 萬顆星星的南半球星空圖上,天文學家想找出某種特征的星體,需要 169 天的工作量,Atlas 900 只需要 10 秒。

 

在城市大腦中實時處理杭州主城區交通視頻,需要 40 顆傳統 GPU,延時為 300ms,使用含光 800 僅需 4 顆,延時降至 150ms。

 

昇騰 910 和含光 800 有一個共同點,都不單獨對外銷售。昇騰 910 通過 AI 加速模塊、AI 加速卡、AI 服務器等形式對第三方銷售;含光 800 將通過阿里云對外輸出 AI 算力。

 

昇騰 910 和含光 800 可謂是術業有專攻,各自有各自的特點。不管是訓練還是推理,在 AI 應用落地中都至關重要,兩款芯片能夠在各自的領域做到世界第一,足見各自背后團隊的真功夫。同時,這些有著中文古典名字的芯片不斷涌現也代表著國產芯的欣欣向榮。如果有其他的企業能夠做到這一點,相信大家也愿意繼續被這樣的“文字游戲”所套路。

 

參考文章:
《解密華為 Atlas 900:數千顆昇騰 910 構成全球最快 AI 訓練集群》
《阿里第一顆芯片問世 平頭哥發布 AI 芯片含光 800》
《華為推出昇騰 910 芯片 但不以獨立芯片形式面向市場》
《阿里發布 AI 推理芯片“含光 800”,歷時一年半完成設計與驗證》

 

與非網原創內容,未經允許,不得轉載!