DeepSeek正在重塑AI產業(yè)新格局
2025-02-13 09:37:30 來源:法治日報·法治周末
《法治周末》記者 賀寶利
“僅從現(xiàn)象上來看,其對AI行業(yè)乃至國內外科技金融的巨大影響,也堪稱是一項顛覆性的創(chuàng)舉。一方面是DeepSeek的橫空出世,已經讓國外AI行業(yè)依靠壟斷資本用海量數(shù)據(jù)與超強算力堆砌而成的‘高墻小院’瞬間崩塌,另一方面國內外資本市場已經開始重塑中國資產尤其是科創(chuàng)屬性資產的價值重估”。針對近日國內外熱議的“DeepSeek”,中國科技技術發(fā)展戰(zhàn)略研究院研究員周代數(shù)接受《法治周末》記者采訪時,頗感自豪地說道。
1月20日,來自我國AI領域大模型DeepSeek的橫空出世,如同一顆重磅炸彈,在全球AI領域迅速掀起了驚濤駭浪。
截至1月27日,中國人工智能公司深度求索(DeepSeek)發(fā)布的DeepSeek-R1模型轟動業(yè)界,雙雙登頂蘋果中、美兩國應用商店免費APP下載排行榜榜首,超越行業(yè)老大哥Chat GPT。
二十多天過去了,其新聞熱度持續(xù)攀升,成為各領域尤其是科創(chuàng)金融領域共同關注的熱點、焦點。其以獨特的技術優(yōu)勢和創(chuàng)新理念,深刻影響并改變著AI產業(yè)的原有格局,為行業(yè)發(fā)展注入著全新的活力,同時,也開始影響并改寫著與AI有關的上下游產業(yè)鏈。
打破壁壘革新研發(fā)新模式
“長期以來,AI大模型研發(fā)領域面臨著技術難度高、研發(fā)成本巨大的困境。傳統(tǒng)模式依賴巨額資金投入走依靠大量數(shù)據(jù)、超強算力的研發(fā)模式,使得諸多企業(yè)和科研機構望而卻步,整體行業(yè)發(fā)展也在一定程度上受到限制。但DeepSeek卻打破了這一局面,其研發(fā)團隊憑借全新的技術創(chuàng)新,在架構設計和訓練算法上另辟蹊徑,成功實現(xiàn)顛覆性突破”。國外某AI行業(yè)巨頭中國區(qū)一不愿透露姓名的工作人員接受記者采訪時坦言。
DeepSeek目前有兩種版本,即DeepSeek-R1與DeepSeek-V3前者是推理有限的模型,側重于處理復雜的推理任務,為需要深度邏輯分析和問題解決的場景而設計,而后者是通用型大語言模型,重點是為可擴展性和高效處理,目標是在多種自然語言處理任務中實現(xiàn)高效、靈活運用。
記者采訪了解到,DeepSeek采用了無人工干預的強化學習和混合專家模型等創(chuàng)新架構,大幅提升了訓練效率,降低了對算力的要求。在訓練成本上,與國外OpenAI動輒數(shù)千萬美元的投入相比,DeepSeek以極低的成本實現(xiàn)了高性能的模型訓練,這讓更多的參與者看到了進入AI研發(fā)領域的可能性。
DeepSeek自1月20日發(fā)布以來,迅速以其低成本、高性能等特性震撼AI行業(yè)。
首先,在技術層面,它采用了先進的架構設計,如混合專家(MoE)架構,能在執(zhí)行任務時僅激活傳統(tǒng)技術要求有6710億參數(shù)(V3總參數(shù))中的一部分,大大提升了效率。預訓練階段加入強化學習這一創(chuàng)新舉措,使得DeepSeek-V3訓練成本僅為Llama3系列的7%,這在傳統(tǒng)追求高投入、高算力的AI大模型研發(fā)領域,無疑是一個降本增效的重大突破。
在實際應用表現(xiàn)上,DeepSeek也十分亮眼。其在代碼生成、數(shù)學推理、自然語言處理等任務中表現(xiàn)出色,有權威數(shù)據(jù)顯示其在中文理解方面更是超越OpenAI,準確率達到92.5%,響應速度平均僅0.8秒。這種技術實力與成本優(yōu)勢的結合的模式,必將吸引大量依賴AI技術應用者的目光。
以DeepSeek-R1模型為例,公開數(shù)據(jù)顯示其訓練成本僅約557.6萬美元,但其在數(shù)學、代碼、自然語言推理等關鍵任務上,性能直逼OpenAI-o1正式版,實現(xiàn)了與GPT-4o性能效果相抗衡的水平。這與美國AI企業(yè)動輒投入數(shù)億甚至數(shù)十億美元訓練模型的傳統(tǒng)模式,形成鮮明對比。在模型推理層面,有數(shù)據(jù)顯示DeepSeek-R1的價格僅為2.2美元/百萬詞元,而同性能OpenAI-o1的價格高達60美元/百萬詞元,這使得AI應用的推理成本大幅降低,讓推理大模型調用進入平價時代。
DeepSeek通過顯著提高數(shù)據(jù)質量和改進模型架構,展示了一條與之前大模型不同的高效訓練途徑。國際投行摩根士丹利的評價耐人尋味:“更大(的模型)不再等于更聰明;DeepSeek的模型現(xiàn)在低成本優(yōu)勢突出,與國際知名大模型相比,其成本大約低了一個數(shù)量級?!?/p>
事實上,AI成本的下降是讓DeepSeek能夠從諸多大模型中脫穎而出的重要原因。據(jù)DeepSeek官網顯示,API的定價每百萬輸入tokens 1元(緩存命中)/4元(緩存未命中),每百萬輸出tokens 16元。這個收費相當于OpenAI-o1運行成本的約三十分之一。DeepSeek也因此被迅速冠以“AI界拼多多”。
“這種低成本、高性能的技術突破,打破了人們對美國AI產業(yè)長期以來在技術研發(fā)路徑上的固有認知,即認為只有通過巨額資金投入、堆砌算力和海量數(shù)據(jù)投喂,才能訓練出頂尖的AI模型。DeepSeek的成功證明,創(chuàng)新的算法和架構同樣能夠實現(xiàn)卓越的模型性能,為全球AI技術發(fā)展開辟了新的道路?!鼻笆鰢饽矨I行業(yè)巨頭中國區(qū)工作人員如此評價。
開源共享構建產業(yè)新生態(tài)
開源策略是DeepSeek影響AI產業(yè)格局的又一重要舉措。
“為技術構筑高墻壁壘、以知識產權、商密資產保護為由為技術乃至產品甚至行業(yè)形成閉源模式,是西方商業(yè)領域圖謀壟斷獲利的通行做法。在資本巨鱷云集壟斷的AI領域,中國DeepSeek反其道而行之,將自身核心技術向全球開發(fā)者開放,這一行動猶如在平靜的湖面投入了一塊巨石,必然會激起千層浪”。上海金融與發(fā)展實驗室特聘專家、科創(chuàng)金融價值評估理論體系創(chuàng)始人楊川接受記者采訪時,如此介紹評價。
記者采訪了解到,開源意味著更多的開發(fā)者能夠基于DeepSeek的模型進行二次開發(fā)和創(chuàng)新應用。無論是個人開發(fā)者,還是初創(chuàng)企業(yè),都可以借助DeepSeek的技術基礎,快速搭建起自己的AI應用場景,無需從頭開始進行復雜的模型訓練。
公開信息顯示,DeepSeek的自信開源,已經對美國部分AI企業(yè)乃至行業(yè)形成直接沖擊。美國科技巨頭英偉達、微軟、亞馬遜在1月31日幾乎同時宣布接入DeepSeek-R1模型。DeepSeek-R1的洪鐘大呂無疑讓美國AI企業(yè)深刻意識到了DeepSeek的強大競爭擠壓。
“我們原來使用LLaMa智能大模型,現(xiàn)在替換成Deepseek,使用成本預估由原來的每月十幾萬美元下降到忽略不計?,F(xiàn)在Deepseek已經成為近期美國人熱議的話題?!比涨?,由知名投資銀行家王世渝策劃組織的“D12數(shù)字春秋論壇Deepseek專題討論會”會上,來自美國的劉瑞華博士線上介紹了她使用Deepseek的真實感受。華人劉博士在美國專注于一項攻克皮膚癌科創(chuàng)企業(yè)的孵化,Deepseek的使用低成本與開源讓她感受到了巨大的實惠與便利的同時“也感受到了華裔研究人員過去從未有過的尊重與自豪”。
市場調查顯示,在智能客服領域,許多國際企業(yè)開始采用DeepSeek的技術,以提升客服效率和客戶滿意度。這使得原本依賴美國AI技術的相關企業(yè)紛紛出現(xiàn)轉向,客觀上將導致美國AI企業(yè)在該領域市場份額受到擠壓。在內容創(chuàng)作方面,DeepSeek能夠快速生成高質量的文案、圖像等內容,吸引了眾多媒體、廣告公司等客戶,進一步削弱了美國AI企業(yè)在內容生成市場的優(yōu)勢。
與美國企業(yè)轉向青睞DeepSeek一致的是,我國國內也掀起了一場積極擁抱DeepSeek的熱潮。最新消息顯示,繼互聯(lián)網大廠先后宣布上線DeepSeek后,我國國內多個AI醫(yī)療、多家新能源車企也宣布接入DeepSeek。近日,工信部宣布我國聯(lián)通、移動、電信三大基礎電信企業(yè)均全面接入DeepSeek開源大模型,實現(xiàn)在多場景、多產品中應用,針對熱門的DeepSeek-RI模型提供專屬算力方案和配套環(huán)境,助力國產大模型性能的釋放。
楊川認為,“這種顛覆性的開源共享模式,不僅會促進行業(yè)技術的快速傳播和迭代,還會構建起一個充滿活力、互利共贏的AI產業(yè)新生態(tài),打破了以往少數(shù)巨頭壟斷技術的局面”。
沖破格局改寫商業(yè)新規(guī)則
“DeepSeek的崛起,必將促使美國AI巨頭們對自身產業(yè)發(fā)展的戰(zhàn)略規(guī)劃以及行業(yè)商業(yè)規(guī)則,重新定位與調整。長期以來,美國AI企業(yè)在研發(fā)過程中給人們的印象是過于依賴高成本的算力投入和大規(guī)模的數(shù)據(jù)收集。而DeepSeek通過優(yōu)化算法、創(chuàng)新架構,實現(xiàn)了低成本、高性能的發(fā)展模式必然是對行業(yè)發(fā)展的一種創(chuàng)新顛覆”前述中國科技技術發(fā)展戰(zhàn)略研究院研究員周代數(shù)如此認為。
來自資本市場的消息顯示,其中DeepSeek概念股持續(xù)火爆。統(tǒng)計顯示A股在2月5日開市,第一周僅有3個交易日,盡管首個交易日未能“開門紅”,但隨后兩日的上攻表現(xiàn)強勢,2月7日,滬指重回3300點上方,成交額放大到1.99萬億元。從首周表現(xiàn)來看,滬指已累計上漲1.63%,深指上漲4.13%,創(chuàng)業(yè)板指漲幅達5.36%,北證50指數(shù)漲幅更是超過12%??萍脊杀憩F(xiàn)十分搶眼,其中,DeepSeek概念股持續(xù)火爆,連續(xù)4天位居A股概念板塊漲幅榜前列。
DeepSeek的火爆出圈,也影響著投資者重塑對中國資產的認知,讓中國科技類資產的價值正被重估。
近日,德意志銀行、高盛、美國銀行等多家外資機構紛紛發(fā)聲,加入看好中國資產的行列。德意志銀行在一份中國股市策略報告中表示,2025年將是中國企業(yè)在全球崛起的一年,中國股票估值折價的現(xiàn)象將消失。該報告認為,A股和港股的牛市周期已于2024年開啟,有望持續(xù)下去并超過此前高點。高盛則在研報中預計,今年MSCI中國指數(shù)有14%的上漲潛力。在樂觀預期下,漲幅有望達到28%。高盛看好中國的科技股,認為更加光明的增長前景和技術突破將帶來巨大的生產力提升,有助于縮小美國與中國科技股或半導體股票之間高達66%的估值差距。
“一方面,部分投資者擔憂DeepSeek的低成本優(yōu)勢會使傳統(tǒng)以‘高投入、高算力’為核心的研發(fā)路徑受到沖擊,進而影響AI上游算力硬件的投資價值。但另一方面,從長遠來看,成本降低將加速下游AI應用的落地,隨著用戶規(guī)模和使用頻次的增加,算力行業(yè)的整體需求仍將增長。”楊川站在實體行業(yè)整體發(fā)展的高度如此分析。
與楊川觀點如出一轍的是,根據(jù)Grok創(chuàng)始人的統(tǒng)計分析結論:過去60年,每10年計算成本降低約為原來的千分之一,但人們的總體購買量增加了10萬倍,總支出反而增長了100倍。這意味著AI下游應用的發(fā)展將帶來更廣闊的市場空間。
“DeepSeek在美國這邊帶來的沖擊更大的是在金融領域。而且?guī)淼氖峭顿Y項目時對項目評估與審視理念發(fā)生了根本性的轉變。過去資本與我們接洽時總是關心我們的財務報表,最近DeepSeek的沖擊讓與我們接觸的資本無一例外地更多開始關注我們成長性、科創(chuàng)屬性?!币驗榍》甑钠つw癌藥物項目正處融資階段,劉瑞華博士同時注意到近期美國資本市場在DeepSeek的影響下,投資端出現(xiàn)了微妙的變化。
“技術實力和創(chuàng)新的發(fā)展模式,對美國AI產業(yè)產生了全方位的顛覆式影響。這不僅改變了全球AI產業(yè)的競爭格局,也為全球AI技術的發(fā)展和應用帶來了新的機遇與挑戰(zhàn)。未來,隨著AI技術的不斷發(fā)展,DeepSeek與美國AI企業(yè)之間的競爭與合作將成為行業(yè)關注的焦點,也將推動全球AI產業(yè)邁向新的發(fā)展階段?!敝艽鷶?shù)也分析道。
拓展邊界催生商業(yè)新模式
“有了DeepSeek的類似工具,讓數(shù)字科技賦能傳統(tǒng)產業(yè)將變得更加容易。”作為中國資本市場早期極為活躍的資深投資銀行家,王世渝有著近30多年的市場從業(yè)經歷,從信奉格雷厄姆、理查·芒格、巴菲特的價值投資理論,到參與國內大量企業(yè)的重組并購,王世渝對數(shù)字科技有了更新的系統(tǒng)理念,他認為“數(shù)字經濟將是實現(xiàn)中華民族偉大復興的必由經濟路徑”。從《D12-中國產業(yè)數(shù)字化解決方案》到數(shù)字蘗變,王世渝帶領一批追隨者結合國內企業(yè)數(shù)字化浪潮進行著深度社會實踐與探索。他認為:“DeepSeek的出現(xiàn)將讓數(shù)字科技賦能實體產業(yè)變得更便捷容易,將會讓身為制造業(yè)大國的中國實體產業(yè),實現(xiàn)一次鳳凰涅槃。”
數(shù)據(jù)顯示,DeepSeek的出現(xiàn)已經為眾多行業(yè)帶來了新的發(fā)展契機,投資圈也隨之積極布局。在金融領域許多企業(yè)正試圖借助DeepSeek的技術優(yōu)化金融數(shù)據(jù)分析、風險管理和智能投顧等業(yè)務,提升服務效率與客戶體驗,增強市場競爭力。
在企業(yè)服務領域,有消息顯示國內多家軟件公司正利用DeepSeek提升企業(yè)管理軟件的智能化水平,推動企業(yè)數(shù)字化轉型,拓展市場份額。同時,不少企業(yè)紛紛與DeepSeek展開合作,2月份以來,騰訊云、360、華為云等大廠相繼宣布與其牽手。
“隨著DeepSeek技術的不斷成熟和應用場景的持續(xù)拓展,AI技術與各行業(yè)的融合也更加深入,必將催生出一系列新的商業(yè)模式?!睏畲ǚ治龅溃跋嘈旁S多企業(yè)在選擇AI技術解決方案時,不再僅局限于傳統(tǒng)巨頭,而是將目光投向DeepSeek。這使得整個AI市場的競爭更加激烈,競爭規(guī)則也從單純的技術和品牌競爭,轉變?yōu)榧夹g、成本、生態(tài)等多維度的綜合競爭?!?/p>
“DeepSeek垂直應用可滿足不同行業(yè)的特定需求,為行業(yè)發(fā)展帶來新的機遇。其中有兩個行業(yè)將會有快速的商業(yè)化。基于DeepSeek技術的垂直領域應用將在醫(yī)療領域不斷涌現(xiàn),如針對醫(yī)療行業(yè)的智能診斷平臺,通過對大量醫(yī)療數(shù)據(jù)的分析和學習,輔助醫(yī)生進行疾病診斷,提高診斷的準確性和效率;而針對教育行業(yè)的個性化學習系統(tǒng),根據(jù)學生的學習情況和特點,提供定制化的學習方案和輔導內容。”王世渝分析判斷。
另一方面,王世渝認為:圍繞DeepSeek的運用將會形成新的產業(yè)分工和合作模式。一些企業(yè)專注于DeepSeek技術的二次開發(fā)和應用推廣,為其他企業(yè)提供定制化的AI解決方案;一些企業(yè)則提供數(shù)據(jù)標注、模型優(yōu)化等配套服務,與DeepSeek形成上下游協(xié)同發(fā)展的產業(yè)格局。此外,AIaaS(人工智能即服務)平臺也借助DeepSeek技術不斷發(fā)展壯大,通過云端服務的方式,為用戶提供便捷的AI能力調用,進一步降低了AI應用的門檻。
“DeepSeek的出現(xiàn)是AI產業(yè)發(fā)展歷程中的一個重要里程碑,也是數(shù)字科技助力賦能傳統(tǒng)產業(yè)的一次顛覆新機遇。預計未來從技術研發(fā)、生態(tài)構建、市場競爭等多個方面,將全面重塑實體產業(yè)格局。未來,隨著類似DeepSeek技術的持續(xù)進步和應用的不斷深化,數(shù)字科技助推產業(yè)升級轉型的作用將日益凸顯,數(shù)字科技服務于社會經濟發(fā)展、為人類創(chuàng)造更多的價值和可能性將成必然?!敝艽鷶?shù)認為。
■ 鏈接
視覺中國供圖
DeepSeek,全稱杭州深度求索人工智能基礎技術研究有限公司。DeepSeek是一家創(chuàng)新型科技公司,成立于2023年7月17日,使用數(shù)據(jù)蒸餾技術,得到更為精煉、有用的數(shù)據(jù)。由知名私募巨頭幻方量化孕育而生,專注于開發(fā)先進的大語言模型(LLM)和相關技術。注冊地址:浙江省杭州市拱墅區(qū)環(huán)城北路169號匯金國際大廈西1幢1201室。法定代表人為裴湉,經營范圍包括技術服務、技術開發(fā)、軟件開發(fā)等。
2024年1月5日,發(fā)布DeepSeek LLM(深度求索的第一個大模型)。1月25日,發(fā)布DeepSeek-Coder。2月5日,發(fā)布DeepSeekMath。3月11日,發(fā)布DeepSeek-VL。5月7日,發(fā)布DeepSeek-V2。6月17日,發(fā)布DeepSeek-Coder-V2。9月5日,更新API支持文檔,宣布合并 DeepSeekCoderV2和DeepSeekV2 Chat ,推出DeepSeek V2.5。12月13日,發(fā)布DeepSeek-VL2。12月26日晚,正式上線DeepSeek-V3首個版本并同步開源。今年1月31日,英偉達宣布DeepSeek-R1模型登陸NVIDIANIM。同一時段內,亞馬遜和微軟也接入DeepSeek-R1模型。英偉達稱,DeepSeek-R1是最先進的大語言模型。2月5日消息,DeepSeek-R1、V3、Coder等系列模型,已陸續(xù)上線國家超算互聯(lián)網平臺。2月6日消息,澳大利亞政府以所謂“擔心安全風險”為由,已禁止在所有政府設備中使用DeepSeek。2月8日,DeepSeek正式登陸蘇州,并在蘇州市公共算力服務平臺上完成部署上線,為用戶提供開箱即用的軟硬件一體服務。
據(jù)國內AI產品榜統(tǒng)計,DeepSeek應用上線僅20天,日活躍用戶數(shù)就突破2000萬大關。2月1日,日活躍用戶數(shù)突破3000萬,成為史上最快達成這一里程碑的應用模型。