從DeepSeek創(chuàng)新看RISC-V“新貴”崛起
發(fā)布時(shí)間:2025/3/5
RISC-V架構(gòu)所具備的靈活性優(yōu)勢(shì)若能得到充分發(fā)揮,極有希望成為AI推理算力的理想搭檔。未來,“RISC-V+AI將有望成為新組合,如同x86+Windows、Arm+安卓的經(jīng)典組合”。
作為“生而開源”的芯片指令集架構(gòu),RISC-V在過去15年里發(fā)展勢(shì)頭強(qiáng)勁,從嵌入式系統(tǒng)加速挺進(jìn)高性能等復(fù)雜場(chǎng)景,并為AI算力提供新選擇。在RISC-V國(guó)際基金會(huì)2024年批準(zhǔn)的25項(xiàng)標(biāo)準(zhǔn)中,超過一半與高性能或AI相關(guān)。RISC-V國(guó)際基金會(huì)董事會(huì)主席Lu Dai表示,RISC-V指令集最激動(dòng)人心的進(jìn)展之一是Matrix擴(kuò)展,將推動(dòng)RISC-V成為AI領(lǐng)域令人敬畏的力量。
根據(jù)達(dá)摩院玄鐵團(tuán)隊(duì)分享的數(shù)據(jù),2024年RISC-V國(guó)際基金會(huì)會(huì)員數(shù)超過4600,覆蓋70+國(guó)家和地區(qū)。產(chǎn)業(yè)應(yīng)用正在向高性能和并行計(jì)算加速發(fā)展,高性能和AI占比56%。預(yù)計(jì)到2031年,RISC-V在計(jì)算機(jī)領(lǐng)域占比將達(dá)到33%,消費(fèi)領(lǐng)域?qū)⑦_(dá)到39%,自動(dòng)駕駛領(lǐng)域達(dá)到31%,數(shù)據(jù)中心達(dá)到28%,工業(yè)達(dá)到27%,網(wǎng)絡(luò)達(dá)到26%。同時(shí),RISC-V高性能和AI基礎(chǔ)軟件生態(tài)日趨完善,國(guó)內(nèi)外主流操作系統(tǒng)支持RISC-V架構(gòu),主流AI框架和模型支持RISC-V架構(gòu)。
“RISC-V從發(fā)布至今只有短短的15年,它在全球芯片產(chǎn)業(yè)鏈中的地位正不斷提升?!敝袊?guó)工程院院士倪光南指出,RISC-V的發(fā)展需要持續(xù)研發(fā)投入、高水平IP設(shè)計(jì)和全球化生態(tài)共建。而要真正進(jìn)入數(shù)據(jù)中心和高性能計(jì)算市場(chǎng),RISC-V必須要在SPECint 2006基準(zhǔn)測(cè)試中跑出超過15分的高性能標(biāo)準(zhǔn)。
DeepSeek帶來的變革與契機(jī)
隨著DeepSeek等大模型的興起,AI領(lǐng)域正經(jīng)歷著前所未有的變革,這也為RISC-V架構(gòu)帶來了新的發(fā)展契機(jī)。在北京開源芯片研究院首席科學(xué)家包云崗看來,AI推理的算力需求正呈現(xiàn)出兩個(gè)顯著特征:
- 與CPU緊密協(xié)作。AI推理將會(huì)成為未來各種業(yè)務(wù)中不可或缺的環(huán)節(jié),但業(yè)務(wù)主程序仍運(yùn)行在CPU上——通過API調(diào)用將AI推理請(qǐng)求卸載到AI加速器,得到推理結(jié)果后再由CPU返回給用戶
- 呈現(xiàn)多樣化需求。不同場(chǎng)景產(chǎn)生不同的算力需求,相應(yīng)的資源約束也不同。比如云端推理算力要考慮滿血版大模型的高效部署,端側(cè)應(yīng)用場(chǎng)景則往往會(huì)部署不同容量的裁剪版。
基于此,包云崗認(rèn)為“RISC-V+AI迎來發(fā)展新契機(jī)”。也就是說,AI加速器在設(shè)計(jì)時(shí)需要充分考量與CPU的協(xié)同工作,并且要依據(jù)不同的需求實(shí)現(xiàn)高效定制。RISC-V架構(gòu)所具備的靈活性優(yōu)勢(shì)若能得到充分發(fā)揮,極有希望成為AI推理算力的理想搭檔。
他大膽預(yù)測(cè),“RISC-V+AI將成為未來新組合,就如同x86+Windows、ARM+安卓的經(jīng)典組合那樣”。市場(chǎng)分析機(jī)構(gòu)Omdia的預(yù)測(cè)也從側(cè)面印證了這一趨勢(shì),預(yù)計(jì)到2030 年,基于RISC-V的AI處理器出貨量將超過5億顆。
“RISC-V在發(fā)展過程中,不應(yīng)一味地將目光聚焦于對(duì)Arm的替代,而是要充分發(fā)揮自身靈活、可定制的獨(dú)特優(yōu)勢(shì),以此形成強(qiáng)大的產(chǎn)業(yè)競(jìng)爭(zhēng)力。”包云崗強(qiáng)調(diào)說。
阿里達(dá)摩院首席科學(xué)家、知合計(jì)算CEO孟建熠也表達(dá)了相同的看法。他認(rèn)為DeepSeek的出現(xiàn)打破了算力、內(nèi)存、互聯(lián)原有的平衡,通過一系列創(chuàng)新技術(shù),新算力架構(gòu)也有機(jī)會(huì)與傳統(tǒng)經(jīng)典架構(gòu)站在同一起跑線,讓開源大模型單機(jī)部署成為可能,有力推動(dòng)實(shí)際應(yīng)用的落地。
但DeepSeek的誕生,也引發(fā)了業(yè)界三個(gè)主要觀點(diǎn)的爭(zhēng)論:
- 開源還是閉源架構(gòu):DeepSeek證明了開源模式在當(dāng)下也能取得顯著成果,為行業(yè)發(fā)展提供了新的思路和方向。
- 用DENSE模型還是用MoE(混合專家模型)模型:DENSE模型是全能型選手,而MOE模型在專屬領(lǐng)域表現(xiàn)出色,兩種模型都有各自的優(yōu)勢(shì)和發(fā)展前景。
- 內(nèi)存容量成為AI大模型在算力以外的另一個(gè)指標(biāo):這促使行業(yè)更加關(guān)注底層硬件能力的適配,注重算力資源的精細(xì)化匹配,改變了過去“大炮打蚊子”式的資源浪費(fèi)現(xiàn)象,強(qiáng)調(diào)從軟硬件深度融合的視角重構(gòu)系統(tǒng)設(shè)計(jì),通過算法與硬件的聯(lián)合優(yōu)化提升整體效率,形成更高效的AI計(jì)算范式。
以RISC-V為基礎(chǔ)構(gòu)建處理芯片
按照孟建熠的說法,DeepSeek、Llama、Grok等開源大模型的涌現(xiàn),并非只是RISC-V的機(jī)會(huì),而是包括GPGPU、x86、DSA、ASIC等所有架構(gòu)的機(jī)遇。但RISC-V 架構(gòu)憑借其獨(dú)特優(yōu)勢(shì),在實(shí)現(xiàn)AI原生方面具有顯著潛力,“RISC-V+AI”很可能成為現(xiàn)階段架構(gòu)創(chuàng)新的理想答案。
開放性和可擴(kuò)展性顯然是RISC-V在AI領(lǐng)域具備的首要優(yōu)勢(shì)。與x86和Arm等架構(gòu)相比,RISC-V的ISA指令集架構(gòu)完全開放,無需支付任何授權(quán)費(fèi)用,任何參與者都能自由使用。其國(guó)際合作開發(fā)模式保障了全球范圍內(nèi)的兼容性,不同地區(qū)基于RISC-V 的芯片設(shè)計(jì)均可實(shí)現(xiàn)無縫對(duì)接。而且,RISC-V允許在芯片設(shè)計(jì)過程中添加定制指令以滿足特定需求,這使得RISC-V芯片既能與舊有軟件兼容,又能支持新功能的拓展。
其次,開源社區(qū)的開放協(xié)作,讓各類大模型在基礎(chǔ)架構(gòu)設(shè)計(jì)上相互借鑒,形成技術(shù)方案趨同的行業(yè)現(xiàn)象,這不僅降低了重復(fù)研發(fā)成本,還推動(dòng)了針對(duì)硬件的針對(duì)性優(yōu)化。第三,DeepSeek將大模型蒸餾,使得更多模型能夠走向端側(cè),而端側(cè)豐富的應(yīng)用場(chǎng)景將形成正向促進(jìn),讓高性能AI應(yīng)用能夠在邊緣設(shè)備上順利運(yùn)行。
在AI領(lǐng)域,RISC-V的包容性很強(qiáng),可以支持CPU/DSA的設(shè)計(jì),也能用于GPU、多核產(chǎn)品或者近內(nèi)存計(jì)算的開發(fā)。隨著開源RISC-V 架構(gòu)的迅猛發(fā)展,重新自研架構(gòu)已意義不大,以RISC-V為基礎(chǔ)構(gòu)建處理芯片成為未來主流趨勢(shì)。孟建熠指出,當(dāng)下發(fā)展RISC-V意義重大,最終行業(yè)必然走向生態(tài)統(tǒng)一。
阿里巴巴達(dá)摩院資深技術(shù)專家李春強(qiáng)表示,DeepSeek通過MOE等技術(shù),大幅降低了同等效果下對(duì)算力的需求,這給后續(xù)芯片在計(jì)算能力、存儲(chǔ)容量/帶寬、芯片互聯(lián)等方面的設(shè)計(jì)帶來了新的平衡點(diǎn)。
盡管前景廣闊,但RISC-V在AI領(lǐng)域的發(fā)展并非坦途,仍面臨著諸多挑戰(zhàn)。
包云崗坦言,RISC-V當(dāng)前在開發(fā)的軟硬件工具箱方面還不夠豐富,與成熟的x86和Arm架構(gòu)相比,存在著較大的差距。例如,在工具鏈、編譯器、調(diào)試工具以及庫(kù)等方面,RISC-V的生態(tài)系統(tǒng)尚不完善,這在一定程度上限制了開發(fā)者的開發(fā)效率和應(yīng)用的拓展。同時(shí),為了增強(qiáng)行業(yè)對(duì)RISC-V的信心,打造具有代表性的RISC-V標(biāo)桿產(chǎn)品案例成為當(dāng)務(wù)之急,這也是RISC-V生態(tài)能夠持續(xù)成長(zhǎng)和壯大的關(guān)鍵所在。
打造標(biāo)桿產(chǎn)品是RISC-V發(fā)展的關(guān)鍵
雖然RISC-V本身與AI契合度高,但如何讓其在市場(chǎng)中廣泛應(yīng)用是業(yè)界關(guān)注的重點(diǎn)。實(shí)際上,RISC-V在一些領(lǐng)域的生態(tài)已取得一定成果,從低功耗IoT場(chǎng)景到服務(wù)器場(chǎng)景,都有相關(guān)產(chǎn)品和生態(tài)出現(xiàn),也誕生了一些標(biāo)桿產(chǎn)品。阿里云無影事業(yè)部總裁張獻(xiàn)濤預(yù)測(cè),RISC-V架構(gòu)從低功耗IoT終端大規(guī)模應(yīng)用到數(shù)據(jù)中心,大概在5至8年內(nèi)就能實(shí)現(xiàn)。
不過,這只是RISC-V發(fā)展的第一步。未來,它需要從“小標(biāo)桿產(chǎn)品”邁向“大標(biāo)桿產(chǎn)品”,這才是奠定RISC-V未來生態(tài)發(fā)展的關(guān)鍵一步。
以玄鐵的探索歷程為例,2019年7月,玄鐵發(fā)布業(yè)界最高性能RISC-V處理器C910,是全球首個(gè)運(yùn)行頻率超過2GHz、SPECINT2K6達(dá)到7分/GHz的RISC-V處理器。2021年10月,玄鐵C910成功兼容安卓系統(tǒng),可運(yùn)行Chrome瀏覽器等應(yīng)用,這是芯片行業(yè)首次實(shí)現(xiàn)RISC-V架構(gòu)對(duì)安卓的支持,意味著RISC-V架構(gòu)有望打破場(chǎng)景壁壘,成為高性能芯片設(shè)計(jì)的新選擇。
國(guó)際RISC-V企業(yè)也在積極行動(dòng)。例如Tenstorrent 采用獨(dú)特的硬件和軟件緊密結(jié)合的方法,其硬件專門用于AI任務(wù),而軟件并不復(fù)雜,整個(gè)軟件堆棧只有大約50000 行代碼。VENTANA公司最新的CPU產(chǎn)品VEYRON V2,性能也超過了Arm Neoverse V2.
“RISC-V要真正在產(chǎn)業(yè)中脫穎而出,需實(shí)現(xiàn)更高的性價(jià)比。例如,如何用二十分之一的成本達(dá)到主流AI 芯片的效果,是RISC-V廠商需要思考的問題。”孟建熠進(jìn)一步強(qiáng)調(diào)說,考慮到碎片化是當(dāng)前RISC-V生態(tài)的現(xiàn)狀,因此標(biāo)準(zhǔn)化建設(shè)將是RISC-V下一階段發(fā)展的重要工作之一。
目前,國(guó)際廠商在指令架構(gòu)方面的貢獻(xiàn)高于國(guó)內(nèi)廠商,國(guó)內(nèi)力量的參與度有待提高,且需要將國(guó)內(nèi)多個(gè)進(jìn)行指令集制定工作的組織聯(lián)合起來,統(tǒng)一到一個(gè)平臺(tái)開展工作。而在技術(shù)路線規(guī)劃上,應(yīng)以AI為目標(biāo)先進(jìn)行國(guó)內(nèi)標(biāo)準(zhǔn)制定的嘗試,CPU、GPGPU、TPU在擴(kuò)展上要形成一定梯度,避免指令集出現(xiàn)過多套不同標(biāo)準(zhǔn)。