在人工智能領域,人們對訓練模型的固有印象就是對算力的需求極大。因此,長期以來,諸如英偉達H100 GPU等高算力芯片幾乎成為行業標配,使得國內芯片廠商難以施展拳腳,也制約了我國人工智能的在地化發展。而DeepSeek的出現打破了這一困境,使尖端GPU不再是大模型訓練的唯一解法,讓越來越多的的國內半導體廠商有機會與全球領先的AI模型適配,有望成為驅動國內半導體全產業鏈發展的新引擎。
當前,每天都有像華為昇騰、沐曦、天數智芯、燧原科技、昆侖芯等國內半導體廠商宣布與DeepSeek旗下不同模型展開適配工作的消息,據不完全統計,參與其中的國內廠商已經超過了20家。
DeepSeek提供技術驗證“實練場”
對于國內芯片行業來說,缺乏實際應用場景和技術驗證機會是其發展過程中的一大難題。而DeepSeek為國內芯片提供了寶貴的技術驗證場景。
據了解,DeepSeek在架構創新方面,采用了經DeepSeek-V2驗證的MLA和DeepSeekMoE技術,并引入了無輔助損失負載均衡策略。這種架構優化使得模型在訓練過程中能夠更高效地利用計算資源,減少了對特定高端芯片的依賴。同時,在訓練效率上,DeepSeek設計了專門的FP8訓練混合精度框架,以實現訓練效率和數值穩定性的平衡,還開發了DualPipe算法實現高效的流水線并行處理,降低訓練過程中的通信開銷。
業內專家表示,這些技術創新使得DeepSeek能夠適配國內芯片架構,并且在適配過程中,國內芯片企業可以深入了解模型對芯片性能的需求,從而針對性地進行優化和改進。例如,通過觀察DeepSeek模型在國產芯片上的運行情況,芯片企業可以發現芯片在計算速度、能耗、穩定性等方面存在的問題,并及時調整研發方向,改進芯片設計和制造工藝。這種實際應用中的反饋和優化,對于國內芯片技術的提升至關重要。
目前,華為昇騰、沐曦、天數智芯、摩爾線程、海光信息、壁仞科技、燧原科技、昆侖芯等廠商,相繼宣布適配或上架DeepSeek模型服務,讓國內芯片能夠在實際應用中發揮作用,展示自身的性能和潛力。
例如,天數智芯和合作伙伴僅用時一天,便完成了與DeepSeek R1的適配工作,并且已正式上線多款大模型服務,包括15億、70億、140億參數的蒸餾版Qwen模型等。天數智芯表示,適配完成之后,公司將重點推動基于國內算力資源的DeepSeek大模型應用落地:一是持續優化軟硬件,開發高性能、高性價比的算力產品方案,支持合作伙伴在平臺上推出DeepSeek各大模型在線服務,廣泛提供預訓練、微調和推理服務;二是與合作伙伴開發基于DeepSeek模型的一體機、工作站,將DeepSeek模型接入到各類AI應用服務,提供更多個性化、邊側、端側的服務。當然,天數智芯始終將通用GPU創新突破作為首要任務,發揮自主通用芯片架構優勢,根據DeepSeek帶動的需求變化來研發更高算效的通用GPU產品。
燧原科技和壁仞科技則是已完成對DeepSeek全系列模型的優化,支持從1.5B到70B參數規模的DeepSeek R1蒸餾模型推理部署,覆蓋能源、金融等垂直場景。在這些實際應用場景中,國內芯片的性能得到了充分驗證,也為其在更多領域的應用積累了經驗。通過與DeepSeek的合作,國內芯片在技術驗證和優化方面取得了顯著進展,為其未來的發展奠定了堅實基礎。
2月2日,Gitee AI宣布上線1.5B、7B、14B、32B四個尺寸的DeepSeek R1模型,均部署在沐曦曦云GPU上。2月5日,又確認DeepSeek-V3全精度滿血版(671B)可在沐曦訓推一體GPU上成功運行,并將V3滿血版上線到平臺。沐曦通過與DeepSeek的適配,不僅驗證了自身芯片在AI推理中的性能,也讓更多AI應用開發者看到本土GPU支持大規模模型運行的潛力。
寒武紀作為國內知名的AI芯片廠商,與南京智算中心合作,借助DeepSeek實現了技術與應用場景的有效對接。通過在零售業務場景中的應用,寒武紀芯片的性能得到了實際檢驗,也為其進一步優化產品、拓展市場提供了寶貴經驗。
華為昇騰、海光信息、龍芯中科等GPU/CPU廠商也在積極行動,通過參與DeepSeek模型的訓練優化,提升產品在AI推理市場的競爭力。
同時,DeepSeek的開源特性也為國內芯片的技術驗證提供了便利。眾多開發者基于DeepSeek模型進行二次開發和應用探索,使國內芯片可以在不同的應用場景、不同的算法需求等多樣化的環境下接受檢驗,從而不斷完善自身的性能和功能。
上海天數智芯半導體股份有限公司副總裁郭為告訴《中國電子報》記者,從行業角度看,以DeepSeek為代表的自主大模型創新突破,有助于推動國內算力技術的發展。國內GPU廠商已相繼完成與DeepSeek的適配,實現了深度學習框架與國內硬件的融合,以進一步發揮算力優勢。在適配過程中,AI產業鏈中的芯片廠商與模型開發者之間加強合作,促進了上下游企業的協同發展,共同構建從硬件到軟件的完整生態閉環,完善了庫和框架等工具,有助于構建更加完整、健康的自主AI產業生態。DeepSeek的開源特性可降低開發門檻,吸引更多開發者和上下游企業加入,降低了AI應用開發的門檻和成本,促進AI技術在更多行業的落地和普及。
帶動供應鏈創新發展
DeepSeek也助推了邊緣計算與低成本芯片的發展。它推出的小型模型,如7B參數版本,可在筆記本電腦運行,且性能接近大模型。這種“小而美”模式的興起,使得端側小模型迎來了快速發展,也帶動了低功耗、高能效芯片的市場需求。
以手機、平板電腦、藍牙耳機和智能眼鏡等智能終端設備為例,為了滿足用戶對AI語音交互、圖像識別等功能的需求,這些設備需要搭載具備一定算力的芯片。而DeepSeek的應用,使得這些設備能夠更好地運行端側小模型,實現更高效的AI處理。這就促使了設備制造商加大對國內算力芯片和存儲芯片的采購,推動了國內芯片在智能終端市場的應用。
在服務器領域,隨著企業加速開發和部署人工智能應用,如智能客服、智慧政府、數據分析等,對服務器的算力要求也越來越高。DeepSeek的出現,讓企業能夠在國內算力芯片的支持下,構建高效的人工智能服務平臺,有望帶動國內算力芯片在服務器市場的發展。
半導體行業專家池憲念表示,目前引發的對國內算力需求的增長,如同一條強有力的紐帶,將半導體產業鏈上的各個環節緊密聯系在一起。從芯片設計、制造到封裝測試,再到最終的應用市場,每個環節都因DeepSeek的出現而獲得了新的發展動力。未來,整個國內半導體供應鏈將在DeepSeek的帶動下,形成一個良性循環。但這一趨勢也對國內半導體廠商提出了更多挑戰。從技術迭代角度來看,人工智能技術發展日新月異,新的模型和算法不斷涌現。DeepSeek需要不斷優化自身模型,以保持技術領先地位。國內芯片技術也需要加速升級、及時適配,確保模型與芯片之間的協同效應。
責任編輯:許子皓
- QQ:61149512