隨著人工智能與大數據技術的飛速發展,我們正步入一個以大模型為核心的新時代。然而在這一浪潮中,傳統的馮·諾依曼架構卻逐漸顯露出其狹隘性。
該架構雖然奠定了現代計算機的基礎,但在面對海量數據處理與大模型訓練時,卻受限于存儲與計算分離的設計,導致數據搬運成為性能瓶頸,嚴重制約了計算效率的提升。
為了突破這一瓶頸,業界開始將目光聚焦于另一個計算架構——存算一體,這是一種將存儲和計算功能融合在同一個芯片上的技術架構。
事實上,存算一體的概念由來已久。早在1969年,斯坦福研究所的Kautz等人提出了存算一體計算機的概念。但受限于當時的芯片制造技術和算力需求的匱乏,那時存算一體僅僅停留在理論研究階段,并未得到實際應用。
而近年來,隨著半導體制造技術突破,以及AI等算力密集應用場景的崛起,存算一體技術也得到迅猛發展。2017年,英偉達、微軟、三星等提出存算一體原型,隨后,國內也誕生一批存算一體芯片企業,蘋芯科技是其中之一。
8月8日,蘋芯科技正式發布了兩款新品,包括存算一體NPU“PIMCHIP-N300”和多模態智能感知芯片“PIMCHIP-S300”,后者采用的是28納米制程工藝。
蘋芯科技CEO楊越在接受21世紀經濟報道記者采訪時指出,“存算一體就是要在成熟制程實現高級制程的計算能力,這讓我們不用非去卷高級制程”。
打破馮·諾依曼架構
在存算一體技術出現之前,計算架構基本都是遵循馮·諾依曼架構,即存儲與計算單元分離。
楊越向記者表示,在馮·諾依曼架構下,當計算發生時,數據需要在存儲和計算單元直接傳輸。而在AI算力芯片中,超過90%的功耗都消耗在傳輸上,所以原來的架構在計算效率上很難支撐AI的發展。
此前,提高計算效率的辦法就是升級制程工藝,從最初的65納米、40納米已經變成7納米、5納米甚至3納米。然后,這種方法后來也遭遇了瓶頸。
因此2020年前后,國內出現一批公司,他們試圖從其他維度去解決計算效率提升的問題。“比如存算一體公司、量子計算公司、光子芯片公司等,這些公司希望去改變芯片的架構來減少數據的搬移。而在不同的技術路徑中,存算一體是落地性最強的一個賽道”。楊越說。
在存算一體賽道中,不同公司也存在差異,主要是底層所采用的Memory(存儲器)類型不同。有的是用flash做,有的是用靜態隨機存儲器(SRAM)做,還有的是用新型存儲器——憶阻器來做。
楊越告訴記者,不同的Memory所具有的特性不同,有的密度高,有的耐久性更好。而蘋芯科技選擇SRAM,是因為它的產品化能力最強。
“在用戶最關心的幾個性能維度上,比如讀寫的延時、耐久性、Memory可擦寫的次數、高級制程兼容性等,SRAM的表現都是最優的。另外,因為SRAM在計算機體系中已經存在幾十年了,它的成本、良率都很穩定。所以如果想要快速產品化,SRAM會是最優的解決方案”。楊越表示。
另外,即便是使用同一種Memory來做的企業,面向的場景也可能不同。有些公司選擇了大算力場景,比如汽車、服務器,蘋芯科技選擇的則是小端側場景,比如智能可穿戴設備、智慧家居等。
楊越稱,選擇小端側場景,是因為算力整體并不是特別大,但是對于功耗的要求又比較敏感。“做出這一選擇,我們是從電路、系統架構、應用、成本等角度進行了綜合考量,覺得小端側場景更適合快速出產品”。
他舉例說,“我們團隊的背景之前都是做新型存儲器的,但我們仍然采用SRAM方案,核心原因就是我們認為這個方案在2-3年內可以產品化,這是符合投資人商業邏輯的,也是符合產業商業邏輯的”。
大廠留下的機會
目前,包括英特爾、三星、IBM、AMD等在內的傳統芯片廠商都在布局存算一體,蘋芯科技等初創公司如何應對與巨頭的競爭?
楊越表示,從行業角度,大家做的事情是趨同的,就是希望讓數據的搬運徹底消失。包括蘋芯科技在內的一些初創公司,其優勢在于選擇了存內計算方案,這幾乎能將縮短數據距離這件事做到極致化。但大廠們不太可能去這樣做,因為他們要考慮通用性的問題,這實際上也為創業公司提供了機會。
據記者了解,存算一體技術可分為三類:近存計算(Processing Near Memory, PNM)、存內處理(Processing In Memory, PIM)和存內計算(Computing In Memory, CIM)。
其中,近存計算是利用先進的封裝技術,將計算芯片和存儲器封裝到一起,通過減少內存和處理單元之間的路徑,提高傳輸效率;存內處理側重于將計算過程盡可能地嵌入到存儲器內部,減少處理器訪問存儲器的頻率;存內計算則是將計算和存儲完全融合的技術,通過電路革新或集成額外的計算單元來實現。
因為存內計算對制程工藝要求不高,所以這也是國內創業公司主要選擇的技術路徑。華西證券在一份研報中指出,近存計算的代際設計成本較低,適合傳統架構芯片轉入,目前該技術已經十分成熟,被廣泛應用于各類CPU和GPU上。而存內計算主要用于算法固定的場景算法計算。
楊越指出,目前電子產品正朝著小型化、智能本地化的方向發展,這給存算一體創業公司帶來了很大的市場機遇。
“小型化意味著電池不能做得太大,然后還要去很好地驅動AI計算,這在傳統架構中很難實現。比如現在基于傳統架構的一些智能設備,當它們打開AI功能時,非常容易發熱,原因在于有大量的數據搬運,而存算一體可以將產品體驗變得更好”。他說。
據楊越介紹,蘋芯科技的產品未來會有兩個迭代方向,一是在功能上,要從現在的卷積神經網絡(CNN)迭代到Transformer模型,二是在計算效率上,會把制程工藝從現在的28納米,升級到22納米、14納米,最終定格在12納米。