通信世界網消息(CWW)當前,DeepSeek掀起的“模型熱”還在持續升溫。
正如通信世界全媒體年初所預測的,2025年大模型乃至智能體將迎來進一步繁榮,行業大模型將深度融入核心業務與應用、AI終端以及智能體將加速落地。具體到如何實現,DeepSeek仿佛一陣“及時雨”,憑借低成本、高效能以及廣泛的應用場景,為行業實踐提供了良好的技術支撐與應用基礎。
可喜之余,對于渴望在未來大模型領域闖出一片天的企業來說,結合自身的業務需求與數據特點,在充分發揮DeepSeek優勢之上,“卷”出更具有獨特競爭力的自研大模型乃至智能體,似乎更值得深思。
前期“卷”接入
實現“共進共生”
最直觀來看,目前DeepSeek掀起的“模型熱”主要表現為DeepSeek的“接入熱”。
其中既包括英偉達、亞馬遜以及微軟等國外科技巨頭,也包括極具市場潛力的中國本土企業,從底層的軟硬件設計研發企業到互聯網大廠、運營商、垂直領域AI公司再到中小型初創企業,選擇DeepSeek似乎已成為當下算力成本飆升與商業化路徑尚未明晰的必然抉擇。
自DeepSeek開放API以來,其生態版圖快速擴張。據不完全統計,目前全球已有超過200家企業宣布接入DeepSeek。就目前來看,接入方式主要分為三類:一是API直接調用,即企業直接調用DeepSeek的云端API,快速集成其通用能力,如文本生成、代碼編寫等。二是模型微調,即企業基于DeepSeek基座模型,注入私有數據進行領域適配,從而實現自身模型優化。三是開源共建,這主要體現在底層架構與設計層面,企業針對DeepSeek開放的部分模型權重,借助社區協作進行自身優化。
總體來看,接入是方式,優化是目的。隨著企業對接入方式的逐漸深入,我們可以發現,企業自研模型與DeepSeek的接入部署,逐漸呈現出全面化、智能化、差異化的特點,兩者結合的模式也逐漸呈現“共生進化”特征。
針對功能補充類,調用API逐漸深入到應用場景接入,例如三大運營商在云能力率先接入的基礎上,已逐漸拓展至to B端、to C端的特色場景與產品服務;多家車企探索將DeepSeek接入智能座艙,實現語音助手功能升級、AI多語義指令識別等。
針對模型部署開發類,私有化部署與產品成為保障安全的選擇,多家企業如中國電信、聯想、新華三、浪潮等均推出了DeepSeek智算一體機,實現一體化開箱即用的私有化部署。與此同時,DeepSeek模型私有化部署服務也涵蓋安裝部署、系統調優和運行維護,可提供適配多種算力的部署包及支持,幫助企業在自有業務場景中構建安全可靠的智能環境。
針對技術融合類,單向的知識蒸餾訓練,即單純接入DeepSeek,可提煉其模型能力至自研模型,降低自身部署成本;多向的模型聯合訓練,即企業自研大模型與DeepSeek大模型進行深度聯合訓練,可以促進聯合創新,為企業帶來更廣闊的發展空間。
中期“卷”經驗
挖掘價值站穩市場
接入與優化滿足當前初步部署應用的需求,但也不可否認,DeepSeek的崛起為自研通用大模型以及行業大模型帶來了沖擊。
在技術競爭方面,DeepSeek的低成本訓練模式和高效推理能力是其優勢所在,也為自研大模型帶來了新的技術競爭壓力。就拿DeepSeek V3來說,其訓練成本僅為557.6萬美元,使用 2048 張 H800 GPU 卡,相比同等規模的模型(如GPT-4、GPT-4o、Llama 3.1),訓練成本大幅降低。這迫使大模型研發者不得不重新審視技術路線,加大在降低訓練成本和提升推理效率方面的研發投入。
在應用場景拓展方面,DeepSeek-R1在科研、數據分析、代碼生成等復雜場景表現出色,DeepSeek-V3適合內容創作、長文本生成等場景??陀^來看,這兩類大模型已較為廣泛地覆蓋了當下通用大模型的應用場景,行業開始出現了新的選擇,即對已入局者以及仍觀望者亮出了新挑戰。
在市場格局重塑方面,DeepSeek的開源和低成本特性,吸引了大量合作伙伴,包括云服務廠商、算力企業等,改變了通用大模型的市場格局。對于行業大模型來說,強調其自身價值之前,似乎必須先證明自己模型對行業專屬數據與場景的理解,比直接調教通用模型懂得更多。
基于此,對于企業自研大模型來說,想要在市場繼續站穩腳跟,正視挑戰與機遇,揚長避短、提升差異化競爭力迫在眉睫。
面向低成本、低算力部署趨勢,大模型行業應借鑒經驗,與自身結合的基礎上更傾向于研發和應用能夠在低成本、低算力條件下運行的技術和模型,以降低使用門檻、擴大應用范圍。
面向當下訓練需求逐漸轉向推理需求,充分挖掘數據價值有望使部分企業脫穎而出。對此,企業應重視數據質量的提升,解決數據孤島問題,加強數據的整合和共享,借助日漸先進的數據處理技術和算法,充分挖掘數據的價值,為大模型優化提供有力支持。
證明自研大模型存在的必要,企業仍需挖掘自身的差異化優勢,結合自身所在行業的特點和資源,找到獨特的應用場景和價值點,實現差異化競爭。例如,猿輔導的猿力大模型在與DeepSeek融合后找準了教育場景下的個性化學習體驗,通過定制化學習方案,并自動調整學習節奏,使孩子逐漸找到學習自信。
后期“卷”效用
兼顧效率與商業化
隨著大模型出現并滲透進日常生活,大模型競爭也進入2.0階段,從長遠來看,大模型已由傳統的技術競賽轉向商業化效率競爭。
就行業啟示來看,低成本推理成為剛需。隨著市場競爭的加劇,算力成本曲線已然成為決定市場格局的關鍵因素。數據閉環能力成為新價值。不同于單純追求數據量,當下更為數據的內容質量以及應用質量。
從效率角度出發,企業應全方位提升模型的研發、訓練與應用效率。首先,在研發環節,企業可以嘗試在算法和架構設計下功夫,同時借助自動化代碼生成工具,減少人工編寫代碼的時間和錯誤。其次,在訓練過程中,合理利用分布式計算技術,優化訓練算法值得探索。最后,進入應用階段,注重推理效率提升,借助模型壓縮等先進技術與經驗,提高推理速度。
從商業化角度出發,企業應精準定位市場需求,制定合理的商業模式。一方面,企業可以針對特定行業的需求,開發定制化的大模型解決方案。另一方面,企業可以將大模型作為基礎平臺,開發一系列的應用產品和服務。
以運營商為例,憑借其自身龐大的用戶數據資源,可以充分發揮自身的網絡和服務優勢,優化迭代一系列to C端的應用產品和服務。例如:基于自然語言處理大模型優化智能客服系統、5G新通話應用以及AI智能助手等,并且根據用戶的使用習慣和歷史數據,為用戶提供個性化的服務推薦,從而增強用戶黏性,挖掘存量市場。
總而言之,大模型2.0時代已經來臨,低成本推理、差異化競爭、數據價值挖掘以及產業鏈定位,構成了這個時代大模型企業發展的關鍵拼圖。企業有待將這些要素緊密結合,積極調整戰略,以適應時代的變化,在市場競爭的洪流中穩步前行,不斷發展壯大。
- QQ:61149512