通用大模型的空前突破,攪動了人工智能(AI)的一池春水。然而,面對AI突破性發展帶來的對AI芯片的井噴式需求,國內芯片供應卻并未跟上此番步伐。隨著科技巨頭公司和新興企業爭先涌入大模型的競爭賽道,新一輪的AI芯片短缺問題正在浮出水面。
AI浪潮“炒熱”芯片需求
AI芯片,也被稱為AI加速器或計算卡,是專門用于處理AI相關計算任務的芯片。它們是構筑算力的重要基石。
中國信息通信研究院在8月19日發布的《中國綜合算力指數(2023年)》白皮書顯示,我國算力產業保持高速增長,其中人工智能算力在整個算力結構中的占比已經超過25%。我國算力總規模近五年年均增速近30%,數據中心機架數量年復合增長率超過30%。
“受大模型熱潮影響,智算算力市場的需求旺盛。”北京超級云計算中心技術CTO甄亞楠對人民網財經表示,當前相關的算力服務器呈現持續緊缺狀態,配貨周期偏長。服務器制造商普遍預計要等待6個月以上才能獲得最新的GPU,而GPU的供應短缺情況至少會持續到明年。
不僅供應緊張,價格也節節攀升。以目前較為主流的英偉達A100GPU為例,大模型的單次訓練要求至少百卡、千卡規模。依據當前市場價格,建設1000卡GPU規模的算力集群成本可達2億元。
在大模型建設正酣的同時,人工智能技術與健康、教育、交通等其他領域的交叉融合也逐漸加深。華大基因高性能計算研發總監王浩靈表示,基因行業對算力的需要不斷增長。他進一步表示:“未來,大型語言模型的加入還將進一步提高疾病診斷分析效率。”
中國工程院院士高文將算力比作電力,視為數字經濟發展的重要指標。燧原科技創始人、董事長兼CEO趙立東認為,大模型算力需求將進一步驅動AI芯片的研發,“如今的AI芯片,不僅要高性能、高帶寬、高存儲,而且要高通用性、高效分布式計算,高效集群互聯。”
國產AI芯片市場:挑戰與機遇并存
業內人士表示,目前國內智能算力的發展,特別是適用于大模型訓練的算力,與全球算力發展趨勢相比仍存在較大差距。
甄亞楠坦言,算力的短缺不僅會削弱人工智能算法的復雜度與性能提升、延緩模型訓練速度、約束應用部署規模,更會阻礙人工智能技術的發展,“許多創新的算法和方法需要大規模的計算資源來驗證和改進,缺乏足夠的算力將限制研究人員的創造力和實驗空間,從而阻礙人工智能技術領域的進一步突破。”
近年來,我國人工智能算力芯片的市場格局主要由美國公司英偉達主導,其占據了80%以上的市場份額,一直保持著無可匹敵的競爭優勢。然而,隨著美國對高性能芯片出口限制措施不斷加強,英偉達最先進的A100、H100芯片無法在國內銷售,定制版A800和H800又缺貨嚴重,在這種情況下,國產AI芯片肩負起填補市場空缺的重要使命。
據人民網財經不完全統計,目前,百度、阿里巴巴、騰訊和華為等互聯網巨頭公司已加快AI芯片的自研步伐,并在各自的云平臺上率先試用。與此同時,一些初創公司則從芯片的底層架構設計入手,試圖通過“彎道超車”抓住機遇。
公開資料顯示,2018年創立的AI芯片設計商墨芯憑借雙稀疏化算法技術,通過軟硬件結合為AI計算模式和芯片架構帶來了顛覆性創新,取得了比國際主流GPU產品更好的測試成績;2017年創立的鯤云科技自主研發了全球首款大規模商用的數據流AI芯片,用更少的芯片資源實現了數倍的實測性能,擺脫對最新制程工藝的依賴。
但需要指出的是,目前,國產AI芯片在大模型推理方面表現相對出色,而在門檻更高的大模型訓練方面仍無法與英偉達的通用GPU相媲美。
中國電子技術標準化研究院副院長陳大紀表示,國內產品的軟硬件以及面向不同場景的生態落地仍需要進一步完善。
多位業內人士表示,在性能方面,英偉達相繼推出了A100和H100,計算性能大幅提升,國內AI芯片訓練產品與其差距十分明顯,尤其是在實際使用中的性能差距更大;在生態方面,英偉達GPU配套的CUDA軟件生態系統廣泛應用,國內AI芯片面臨著“要么兼容一個不開源的生態,要么從零開始自建生態”的兩難選擇。
具體而言,國產AI芯片普遍存在軟件棧不完善、適配周期長、性能差距大、可靠性需要驗證等問題,這導致國內企業對其采用的意愿不強。此外,生態系統和自主工藝等難題也有待突破。
“只有解決了這些問題,國產AI芯片才能真正被廣泛應用起來。”天數智芯董事長兼CEO蓋魯江說。
國產AI芯片該如何發力?
近年來,我國高度重視AI芯片產業,發布了一系列支持政策,營造良好產業環境,在技術創新、項目建設、資金保障、標準制定和人才培養等方面都給予了扶持,為我國AI芯片發展打下了政策基礎。
從產業角度看,樂觀地說,國產AI芯片可謂正處于百花齊放、百家爭鳴的萌發階段,各主體正在激烈的市場競爭中快速探索適合的成長道路。
西安交通大學教授任鵬舉推斷:隨著人工智能走深向實、真正與行業邏輯深度融合并廣泛賦能,在數據中心側,AI芯片會繼續維持協處理器或者加速器的形態;在終端應用側,AI最終會收斂為一個關鍵因素,發展為異構或者超異構芯片的形態。
如何進一步提升國產AI芯片競爭力?多位業內人士提出建議:要鼓勵更多企業和社會資本進入AI芯片領域,加大投資力度;加強半導體原理、材料等基礎研究投入,推動多學科的交叉融合研究;加快工藝創新進步,構建本土供應鏈體系。
尤其是我國集成電路行業人才短缺問題不容忽視。任鵬舉坦言,“即使每年有近20萬集成電路相關專業高校應屆畢業生,但加入這個行業的卻僅有五分之一。”他建議采取相應措施以提高行業吸引力:一是鼓勵高校和企業建立長期合作伙伴關系,提供獎學金和入學機會以激勵學生畢業后從事該行業;二是借助人工智能技術提高芯片設計能力,吸引擅長軟件和算法的專業人才投身于集成電路行業,進一步推動國產AI芯片發展。
趙立東認為,推動國產AI芯片發展,就是為了有更加充足、更加便捷、更加平價的算力,從而實現真正的算力普惠,而要做到這一點,就必須依靠創新的芯片架構和開源的產業生態。
蓋魯江建議,應協同各方加快制定自主標準,進一步擴大國產通用GPU支持的開發框架、操作系統、算法模型、業務應用以及社區開發者的范圍,建立起自主生態圈。
陳大紀表示,產學研用各單位應以人工智能技術與產業融合創新為導向,聚焦產業智能化場景創新需求,研究、開展與場景結合緊密的智能芯片相關的標準需求,并以標準為依托,共同建設人工智能場景創新支撐環境,探索多元主體合作的場景創新新機制,通過助力場景創新,不斷將應用創新與市場需求相結合,合力促進我國AI芯生態建設。