剛剛，寒武紀發布了首款雲端AI芯片MLU100：進軍服務器市場

摘要：5月3日，智能芯片公司寒武紀科技在上海舉辦了2018
產品發布會。會上，寒武紀正式發布了多個最新一代終端IP產品——採用7nm工藝的終端芯片Cambricon1M、首款雲端智能芯片
MLU100及搭載

5 月 3 日，智能芯片公司寒武紀科技在上海舉辦了 2018
產品發布會。會上，寒武紀正式發布了多個最新一代終端 IP 產品——採用 7nm 工藝的終端芯片 Cambricon 1M、首款雲端智能芯片
MLU100 及搭載了 MLU100 的雲端智能處理計算卡。

在人工智能技術的發展過程中，神經網絡正不斷邁向更深、更複雜的方向，而硬件則正朝著機器學習任務處理專用的道路前進。目前，國內已出現十餘家人工智能芯片公司，而寒武紀是其中的佼佼者。作為全球唯一一家
AI 芯片獨角獸，寒武紀於 2016 年誕生於中國科學院計算技術研究所，並率先推出了商用化的深度學習專用處理器 NPU（神經網絡處理器）。

其實，寒武紀科技的產品早已進入普通用戶的手中。去年
10 月，華為發布了搭載全球首款「人工智能處理器」麒麟 970 的手機 Mate 10 系列（以及其後發布的華為 P20、榮耀 V10
系列等），其芯片架構中就包含了寒武紀的 Cambricon-1A 神經網絡處理器。 1A 也由此成為了全球首個成功商用的深度學習處理器 IP
產品。

寒武紀的智能處理器主要針對於人工智能領域計算機視覺、語音識別等方面的任務，面向智能手機、安防監控、可穿戴設備、無人機和智能駕駛等各類應用。據稱，其專為神經網絡任務優化的架構可以使其達到傳統四核 CPU25 倍以上的性能。

與此前僅面向終端設備的芯片 IP 不同，本次發布會上，寒武紀推出的芯片不僅性能更強大，而且還出現了面向雲端服務器等專業應用場景的產品。

第三代終端芯片：寒武紀 1M

首先是終端處理器部分。今天發布的寒武紀 1M 是這家公司的第三代機器學習專用芯片，其性能超越此前廣泛使用的寒武紀 1A 十倍。去年 11 月 6 日，寒武紀在北京舉行了公司成立以來的首場發布會，陳天石在會上披露了 1M 處理器的發展計劃。

在本次發布會上，寒武紀
1M 處理器的具體參數終於展示在人們的眼前。 1M 使用 TSMC 7nm 工藝生產，其 8 位運算效能比達 5Tops/watt（每瓦 5
萬億次運算）。寒武紀提供了三種尺寸的處理器內核（2Tops/4Tops/8Tops）以滿足不同場景下不同量級智能處理的需求，寒武紀稱，用戶還可以通過多核互聯進一步提高處理效能。

寒武紀
1M 處理器延續了前兩代 IP 產品（1H/1A）的完備性，可支持 CNN、RNN、SOM 等多種深度學習模型，此次又進一步支持了
SVM、k-NN、k-Means、決策樹等經典機器學習算法的加速。這款芯片支持幫助終端設備進行本地訓練，可為視覺、語音、自然語言處理等任務提供高效計算平台。「這意味著使用
1M
的設備可以根據用戶行為對應用進行個性化定制，」陳天石表示。「本地訓練同時也解決了用戶數據隱私的問題。它是全球第一款支持本地機器學習訓練的智能處理器產品。」據悉，該產品可應用於智能手機、智能音箱、攝像頭、自動駕駛等不同領域。

首款雲端智能芯片：MLU 100

在去年
11 月份的發布會上，陳天石展示了服務器級 AI 處理器 MLU
系列的發展計劃，寒武紀希望將自己的產品從神經網絡加速拓展到機器學習，以及更多任務中。本次發布的又一大重點就是首次亮相的 Cambricon
MLU 100 雲端 AI
芯片，以及以此為基礎的雲端智能處理計算卡。「在三年前，我們就開始了兩顆測試芯片的研發了。我們時刻準備著將自己的產品放入雲端。」陳天石表示。今天推出的產品正是寒武紀穩步推進的成果。

MLU100
採用寒武紀最新的 MLUv01 架構和 TSMC 16nm 工藝，可工作在平衡模式（主頻
1Ghz）和高性能模式（1.3GHz）主頻下，等效理論峰值速度則分別可以達到 128 萬億次定點運算/166.4 萬億次定點運算，而其功耗為
80w/110w。與寒武紀系列的終端處理器相同，MLU100
雲端芯片具有很高的通用性，可支持各類深度學習和常用機器學習算法。可滿足計算機視覺、語音、自然語言處理和數據挖掘等多種雲處理任務。搭載這款芯片的闆卡使用了
PCIe 接口。

在發布會上，寒武紀的合作夥伴們展示了基於寒武紀芯片的部分應用方案。其中聯想推出了基於 Cambricon
MLU100 的服務器 ThinkSystem SR650。該產品為 2U2 路機架式規格，支持兩個 MLU100
智能處理器計算卡。這款服務器打破了 37 項服務器基準測試的世界紀錄。

中科曙光也在發布會上推出了基於 Cambricon
MLU100 的服務器產品系列「PHANERON」。這款服務器可支持 2-10 塊寒武紀 MLU 處理卡，面向多種智能應用任務。其中
PHANERON-10 集成了 10 塊寒武紀人工智能處理單元，可以為人工智能訓練應用提供 832T 半精度浮點運算能力，在推理時提供
1.66P 整數運算能力。中科曙光錶示，新一代服務器可以在典型場景下將能效提升 30 倍以上。

科大訊飛也在發布會上披露了與寒武紀的深度合作研發項目。

正如
MLU 的系列命名所示，寒武紀希望把旗下芯片的應用範圍由神經網絡（Neural network）擴展到機器學習（Machine
Learning）的加速任務上。由於 IP 授權的方式利潤空間有限，進軍雲端市場或許是寒武紀作為新一代芯片公司發展的必然道路。

寒武紀表示，旗下的終端和雲端產品均原生支持寒武紀
NeuWare
軟件工具鏈，可以方便用戶進行智能應用的開發、遷移和調優。陳天石表示，寒武紀科技創立的初衷就是要讓全世界都能用上智能處理器。寒武紀本次提出了「端雲協作」的理念，這次發布的
MLU100 芯片可以和此前寒武紀 1A/1H/1M 系列終端處理器進行適配，協同完成複雜的智能處理任務。

至此，寒武紀已經形成了覆蓋智能終端設備、自動駕駛以及雲端服務器的 AI 智能芯片 IP 產品線。「寒武紀未來計劃發布自己的編程語言，」陳天石說道，「我們希望自己的合作夥伴能夠基於這套軟件系統發布自己的產品。」

機器之心專訪了寒武紀科技的創始人和 CEO 陳天石，他就一些我們感興趣的話題進行了解答。

機器之心：相對市場上已有的同類芯片，新的產品（MLU100）在設計上具備哪些優勢？

陳天石 ：MLU100 是寒武紀公司長期積累的成果，基於 Cambricon 指令集，在機器學習領域適用面廣。而且得益於寒武紀在微結構方面的創新，達到了最高每秒 166.4 萬億次定點運算的峰值。

機器之心：針對新一代芯片，寒武紀是否會推出相關軟件 API，和完整的解決方案？

陳天石 ：寒武紀公司從
2016 年起，逐步推出了寒武紀 NeuWare 軟件工具鏈，實現對 tensorflow、caffe 和 mxnet 的 API
兼容，並同時提供了寒武紀專門的高性庫，可以方便地進行智能應用的開發，遷移和調優。目前，由於寒武紀在終端的廣泛應用，已經有不少客戶在寒武紀
NeuWare 之上構建了他們的應用。

機器之心：有關產品定位的問題，您認為新的芯片會對目前已有的市場產生衝擊，還是會開拓出新的市場？直接對標的同類產品是什麼？

陳天石 ：寒武紀相信智能是一個快速增長的市場，我們願意和全世界的同行實現合作共贏。

機器之心：寒武紀在 2018 年選擇了「由端入雲」的發展方向，是出於什麼樣的思考？以及如何看待雲端計算的發展趨勢？

陳天石 ：端側的智能處理是非常重要的，因為端可以最快速的響應用戶的需求，能以非常低的功耗、非常低的成本、非常小的延遲，幫助用戶理解圖像、視頻、語音和文本。但是，雲側的智能處理可以把很多端的信息匯聚在一起。比如，在一個城市中有大量的攝像頭，如果想要知道一個特定的物體在多個攝像頭間的運動軌跡，就需要在雲側進行智能處理。

另外，終端的數據量有限，只能根據單個用戶的數據對機器學習模型進行微調。而云可以看到大量用戶的數據。因此，雲端的智能處理在數據方面有其不可替代的巨大優勢，可以利用海量數據，訓練出非常強大的模型。

機器之心：寒武紀的產品線更新戰略是什麼樣的，多久推出一代新的芯片？

陳天石： 寒武紀公司有著一支高效、執行力強的研發隊伍，以及一個穩定的技術路線圖，會以較快的速度不斷推出新的產品滿足市場的需求。寒武紀
2017 年 11 月發布終端 IP 產品 1A 和 1H 的時候，就預告了今年 5 月份的新 IP 產品 1M，和雲端 MLU100 芯片。

機器之心：我們能否期待下一代消費級 NPU 的消息？

陳天石 ：我們通常不稱自己是
NPU，因為 Neural Processing Unit 把應用面限定在神經網絡上。事實上，寒武紀做的是 MLU（Machine
Learning Unit），各種機器學習算法（包括神經網絡深度學習，也包括多種傳統機器學習算法）都能很好地支持。在終端，寒武紀這次發布了 IP
產品 1M，前所未有的具備本地的訓練能力，這給終端用戶個性化、定制化、適配化的智能服務提供了應藉鑑支撐。 1M 的 PPA
也有很大的進步，可以達到 5Tops/W。

機器之心：寒武紀的新一代芯片（MLU 100）在推出之後將與哪些公司展開合作？

陳天石 ：這次發布會上，曙光和聯想都推出了基於寒武紀的雲服務器新產品。我們也在深入同各大雲計算企業深入合作。

本文僅代表作者觀點，不代表百度立場。
本文係作者授權百度百家發表，未經許可，不得轉載。

相關推薦