摘要:5月3日,智能芯片公司寒武紀科技在上海舉辦了2018
產品發布會。 會上,寒武紀正式發布了多個最新一代終端IP產品——採用7nm工藝的終端芯片Cambricon1M、首款雲端智能芯片
MLU100及搭載
5 月 3 日,智能芯片公司寒武紀科技在上海舉辦了 2018
產品發布會。 會上,寒武紀正式發布了多個最新一代終端 IP 產品——採用 7nm 工藝的終端芯片 Cambricon 1M、首款雲端智能芯片
MLU100 及搭載了 MLU100 的雲端智能處理計算卡。
在人工智能技術的發展過程中,神經網絡正不斷邁向更深、更複雜的方向,而硬件則正朝著機器學習任務處理專用的道路前進。 目前,國內已出現十餘家人工智能芯片公司,而寒武紀是其中的佼佼者。 作為全球唯一一家
AI 芯片獨角獸,寒武紀於 2016 年誕生於中國科學院計算技術研究所,並率先推出了商用化的深度學習專用處理器 NPU(神經網絡處理器)。
其實,寒武紀科技的產品早已進入普通用戶的手中。 去年
10 月,華為發布了搭載全球首款「人工智能處理器」麒麟 970 的手機 Mate 10 系列(以及其後發布的華為 P20、榮耀 V10
系列等),其芯片架構中就包含了寒武紀的 Cambricon-1A 神經網絡處理器。 1A 也由此成為了全球首個成功商用的深度學習處理器 IP
產品。
寒武紀的智能處理器主要針對於人工智能領域計算機視覺、語音識別等方面的任務,面向智能手機、安防監控、可穿戴設備、無人機和智能駕駛等各類應用。 據稱,其專為神經網絡任務優化的架構可以使其達到傳統四核 CPU25 倍以上的性能。
與此前僅面向終端設備的芯片 IP 不同,本次發布會上,寒武紀推出的芯片不僅性能更強大,而且還出現了面向雲端服務器等專業應用場景的產品。
第三代終端芯片:寒武紀 1M
首先是終端處理器部分。 今天發布的寒武紀 1M 是這家公司的第三代機器學習專用芯片,其性能超越此前廣泛使用的寒武紀 1A 十倍。 去年 11 月 6 日,寒武紀在北京舉行了公司成立以來的首場發布會,陳天石在會上披露了 1M 處理器的發展計劃。
在本次發布會上,寒武紀
1M 處理器的具體參數終於展示在人們的眼前。 1M 使用 TSMC 7nm 工藝生產,其 8 位運算效能比達 5Tops/watt(每瓦 5
萬億次運算)。 寒武紀提供了三種尺寸的處理器內核(2Tops/4Tops/8Tops)以滿足不同場景下不同量級智能處理的需求,寒武紀稱,用戶還可以通過多核互聯進一步提高處理效能。
寒武紀
1M 處理器延續了前兩代 IP 產品(1H/1A)的完備性,可支持 CNN、RNN、SOM 等多種深度學習模型,此次又進一步支持了
SVM、k-NN、k-Means、決策樹等經典機器學習算法的加速。 這款芯片支持幫助終端設備進行本地訓練,可為視覺、語音、自然語言處理等任務提供高效計算平台。 「這意味著使用
1M
的設備可以根據用戶行為對應用進行個性化定制,」陳天石表示。 「本地訓練同時也解決了用戶數據隱私的問題。它是全球第一款支持本地機器學習訓練的智能處理器產品。」據悉,該產品可應用於智能手機、智能音箱、攝像頭、自動駕駛等不同 領域。
首款雲端智能芯片:MLU 100
在去年
11 月份的發布會上,陳天石展示了服務器級 AI 處理器 MLU
系列的發展計劃,寒武紀希望將自己的產品從神經網絡加速拓展到機器學習,以及更多任務中。 本次發布的又一大重點就是首次亮相的 Cambricon
MLU 100 雲端 AI
芯片,以及以此為基礎的雲端智能處理計算卡。 「在三年前,我們就開始了兩顆測試芯片的研發了。我們時刻準備著將自己的產品放入雲端。」陳天石表示。 今天推出的產品正是寒武紀穩步推進的成果。
MLU100
採用寒武紀最新的 MLUv01 架構和 TSMC 16nm 工藝,可工作在平衡模式(主頻
1Ghz)和高性能模式(1.3GHz)主頻下,等效理論峰值速度則分別可以達到 128 萬億次定點運算/166.4 萬億次定點運算,而其功耗為
80w/110w。 與寒武紀系列的終端處理器相同,MLU100
雲端芯片具有很高的通用性,可支持各類深度學習和常用機器學習算法。 可滿足計算機視覺、語音、自然語言處理和數據挖掘等多種雲處理任務。 搭載這款芯片的闆卡使用了
PCIe 接口。
在發布會上,寒武紀的合作夥伴們展示了基於寒武紀芯片的部分應用方案。 其中聯想推出了基於 Cambricon
MLU100 的服務器 ThinkSystem SR650。 該產品為 2U2 路機架式規格,支持兩個 MLU100
智能處理器計算卡。 這款服務器打破了 37 項服務器基準測試的世界紀錄。
中科曙光也在發布會上推出了基於 Cambricon
MLU100 的服務器產品系列「PHANERON」。 這款服務器可支持 2-10 塊寒武紀 MLU 處理卡,面向多種智能應用任務。 其中
PHANERON-10 集成了 10 塊寒武紀人工智能處理單元,可以為人工智能訓練應用提供 832T 半精度浮點運算能力,在推理時提供
1.66P 整數運算能力。 中科曙光錶示,新一代服務器可以在典型場景下將能效提升 30 倍以上。
科大訊飛也在發布會上披露了與寒武紀的深度合作研發項目。
正如
MLU 的系列命名所示,寒武紀希望把旗下芯片的應用範圍由神經網絡(Neural network)擴展到機器學習(Machine
Learning)的加速任務上。 由於 IP 授權的方式利潤空間有限,進軍雲端市場或許是寒武紀作為新一代芯片公司發展的必然道路。
寒武紀表示,旗下的終端和雲端產品均原生支持寒武紀
NeuWare
軟件工具鏈,可以方便用戶進行智能應用的開發、遷移和調優。 陳天石表示,寒武紀科技創立的初衷就是要讓全世界都能用上智能處理器。 寒武紀本次提出了「端雲協作」的理念,這次發布的
MLU100 芯片可以和此前寒武紀 1A/1H/1M 系列終端處理器進行適配,協同完成複雜的智能處理任務。
至此,寒武紀已經形成了覆蓋智能終端設備、自動駕駛以及雲端服務器的 AI 智能芯片 IP 產品線。 「寒武紀未來計劃發布自己的編程語言,」陳天石說道,「我們希望自己的合作夥伴能夠基於這套軟件系統發布自己的產品。」
機器之心專訪了寒武紀科技的創始人和 CEO 陳天石,他就一些我們感興趣的話題進行了解答。
機器之心:相對市場上已有的同類芯片,新的產品(MLU100)在設計上具備哪些優勢?
陳天石 :MLU100 是寒武紀公司長期積累的成果,基於 Cambricon 指令集,在機器學習領域適用面廣。 而且得益於寒武紀在微結構方面的創新,達到了最高每秒 166.4 萬億次定點運算的峰值。
機器之心:針對新一代芯片,寒武紀是否會推出相關軟件 API,和完整的解決方案?
陳天石 :寒武紀公司從
2016 年起,逐步推出了寒武紀 NeuWare 軟件工具鏈,實現對 tensorflow、caffe 和 mxnet 的 API
兼容,並同時提供了寒武紀專門的高性庫,可以方便地進行智能應用的開發,遷移和調優。 目前,由於寒武紀在終端的廣泛應用,已經有不少客戶在寒武紀
NeuWare 之上構建了他們的應用。
機器之心:有關產品定位的問題,您認為新的芯片會對目前已有的市場產生衝擊,還是會開拓出新的市場? 直接對標的同類產品是什麼?
陳天石 :寒武紀相信智能是一個快速增長的市場,我們願意和全世界的同行實現合作共贏。
機器之心:寒武紀在 2018 年選擇了「由端入雲」的發展方向,是出於什麼樣的思考? 以及如何看待雲端計算的發展趨勢?
陳天石 :端側的智能處理是非常重要的,因為端可以最快速的響應用戶的需求,能以非常低的功耗、非常低的成本、非常小的延遲,幫助用戶理解圖像、視頻、語音和文本 。 但是,雲側的智能處理可以把很多端的信息匯聚在一起。 比如,在一個城市中有大量的攝像頭,如果想要知道一個特定的物體在多個攝像頭間的運動軌跡,就需要在雲側進行智能處理。
另外,終端的數據量有限,只能根據單個用戶的數據對機器學習模型進行微調。 而云可以看到大量用戶的數據。 因此,雲端的智能處理在數據方面有其不可替代的巨大優勢,可以利用海量數據,訓練出非常強大的模型。
機器之心:寒武紀的產品線更新戰略是什麼樣的,多久推出一代新的芯片?
陳天石: 寒武紀公司有著一支高效、執行力強的研發隊伍,以及一個穩定的技術路線圖,會以較快的速度不斷推出新的產品滿足市場的需求。 寒武紀
2017 年 11 月發布終端 IP 產品 1A 和 1H 的時候,就預告了今年 5 月份的新 IP 產品 1M,和雲端 MLU100 芯片。
機器之心:我們能否期待下一代消費級 NPU 的消息?
陳天石 :我們通常不稱自己是
NPU,因為 Neural Processing Unit 把應用面限定在神經網絡上。 事實上,寒武紀做的是 MLU(Machine
Learning Unit),各種機器學習算法(包括神經網絡深度學習,也包括多種傳統機器學習算法)都能很好地支持。 在終端,寒武紀這次發布了 IP
產品 1M,前所未有的具備本地的訓練能力,這給終端用戶個性化、定制化、適配化的智能服務提供了應藉鑑支撐。 1M 的 PPA
也有很大的進步,可以達到 5Tops/W。
機器之心:寒武紀的新一代芯片(MLU 100)在推出之後將與哪些公司展開合作?
陳天石 :這次發布會上,曙光和聯想都推出了基於寒武紀的雲服務器新產品。 我們也在深入同各大雲計算企業深入合作。
版權聲明
本文僅代表作者觀點,不代表百度立場。
本文係作者授權百度百家發表,未經許可,不得轉載。