分享到微信打開微信,點擊底部的“發(fā)現(xiàn)”, |
“DeepSeek比過去兩年多以來,全行業(yè)對于用戶的教育都要更加有效。”近日,談及DeepSeek帶來的變化,OPPO ColorOS系統(tǒng)設(shè)計總監(jiān)陳希對第一財經(jīng)感慨,一夜之間幾乎全民都知道了什么是大模型,對應用企業(yè)來說,這種普及是關(guān)鍵的機會點。
DeepSeek引發(fā)的效應正在每一個行業(yè)發(fā)生。“客戶直接指定了,非常明確地說要DeepSeek。”蜜度首席技術(shù)官劉益東對第一財經(jīng)提及客戶對一體機的要求突然轉(zhuǎn)向。在今年1月初就提出需要一體機產(chǎn)品的客戶,1個月后新的需求是,在原來功能基礎(chǔ)上,希望能將模型換成DeepSeek,同時,也有更多用戶開始來咨詢一體機產(chǎn)品。
從手機、辦公到影像,甚至是農(nóng)田無人機,DeepSeek撬動了越來越多的產(chǎn)業(yè),讓更多的企業(yè)、更多的人開始真正思考,“我必須要用大模型去做一些事情”。陳希認為,這是一個起點,未來一定會驅(qū)動產(chǎn)生一系列的AI實踐。但這場風暴催生的變革初期,挑戰(zhàn)同樣存在。
“小步快跑”用起來
作為一線從業(yè)者,劉益東認為大模型目前經(jīng)歷了兩個重要的階段。第一個階段是2022年ChatGPT發(fā)布之后,引起了市場的廣泛關(guān)注和討論,完成了基礎(chǔ)的市場的教育,但客戶對AI仍然將信將疑,擔憂模型是否真的能夠解決問題。
第二個階段是今年初的DeepSeek,劉益東認為,它完成了更大一輪大模型的市場教育,“大家已經(jīng)不再懷疑大模型到底能不能給我?guī)砉ぷ魃系淖兏锘蛘咝噬系奶嵘^大部分不再猶豫,甚至是我的家人在和我吃飯交流的時候都在討論DeepSeek,基于此我認為它已經(jīng)是一個全民現(xiàn)象級的話題和認知”。
數(shù)據(jù)中心服務廠商超云在2023年就已發(fā)布一體機,但連續(xù)一年多的時間,“大家對于一體機這事兒并不是很感冒”。在一場直播中超云產(chǎn)品運營中心副總經(jīng)理任世杰提到,背后原因一方面是部署成本過高,另外一方面或許與業(yè)務相結(jié)合的效果沒有達到客戶的預期。任世杰發(fā)現(xiàn),直到DeepSeek出現(xiàn)后,一體機的需求開始旺盛。
蜜度主要做B端政企和機構(gòu)的智能辦公、城市治理等服務,也推出了一體機產(chǎn)品,在今年1月他們發(fā)布了針對智能辦公場景的“模力通”。在節(jié)前已經(jīng)溝通過需求的客戶,在節(jié)后新的需求是,希望有一個DeepSeek的選擇。
“客戶問一體機能不能放DeepSeek的模型,我們也緊急在春節(jié)期間,包括節(jié)后就開始產(chǎn)研,做適配和驗證,將它放進去。”劉益東感受到DeepSeek對業(yè)務促進明顯,1月后,更多的客戶來咨詢了,也有已經(jīng)達成的商業(yè)合作。
“在一個大致正確的方向上,我們信奉小步快跑,不斷更精細化地去驗證用戶精細顆粒的需求。”OPPO是第一批接入DeepSeek的手機廠商,談及接入前的思考,陳希表示,在這一確定性很高的趨勢上,內(nèi)部沒有經(jīng)過太長的糾結(jié),“我們想的是怎樣盡快把DeepSeek第一個融入到我們的產(chǎn)品中來,這是一個非常好的一個機會點。”目前ColorOS對外表示“月月有更新”,甚至以周為單位迭代新的功能。
DeepSeek讓更多企業(yè)、更多的人開始思考,“必須要用大模型去做一些事情”。
2024年11月,第一財經(jīng)問及極飛科技創(chuàng)始人兼CEO彭斌大模型在農(nóng)業(yè)無人機的應用,彼時這位創(chuàng)業(yè)老兵對這一問題較為謹慎,他提到計算機視覺這樣傳統(tǒng)AI技術(shù)已經(jīng)在無人機的避障中用起來了,但大模型當下仍有待探索。
四個月后彭斌的答案變了。在3月的采訪中,他對記者表示,DeepSeek的出現(xiàn)是一個有象征意義的節(jié)點,帶來的改變是全方位的。極飛的研究團隊已經(jīng)轉(zhuǎn)為“作戰(zhàn)團隊”開始嘗試落地。
“(以前)我們覺得(大模型的應用)太貴太遠,突然間這么一招,我過年七八天每一天都興奮,和同事一直在群里聊,我們還在電腦上去部署一些蒸餾版的模型,也特別驚艷。”彭斌覺得,2025年新年那一段時間大家經(jīng)歷了有意義的變化,DeepSeek給行業(yè)注入了全新的可能。
“一個通用的大模型,給它一張照片,它會告訴你這是一塊農(nóng)田。但是我們的大模型微調(diào)以后,它應該會告訴你這是種的棉花,長勢如何、什么地方有一點問題,你得去看看。甚至可以給出更重要的意見,比如灌溉沒做好,缺肥缺微量元素,這也是常年在農(nóng)場里干活的農(nóng)業(yè)專家的工作。”彭斌表示,極飛一定會有這樣的AI功能出來。
在DeepSeek之前,沒有廠商將有用且便宜做到一個完美的平衡點。DeepSeek給出了選擇,之后可能也會拉動整個行業(yè),激活大量應用場景的變化。彭斌表示,雖然短期可能看不太出來,但是它會孕育一種生態(tài),慢慢就會發(fā)生,可能再過半年一年去看會很有意思。
成本和性能的平衡
成本和性能的平衡,是不少應用廠商評價DeepSeek催生變革的關(guān)鍵點。
“成本、性能是蹺蹺板的兩端,DeepSeek這個蹺蹺板是平的,不是歪的,如果生成的結(jié)果很差,那么再低的成本都沒有意義,也是因為效果好,大家才會對它這么低的成本感到驚訝。”陳希表示。
彭斌很早就用了ChatGPT,這一AI助手的智能化也給了他非常大的震撼,但當時在團隊的判斷里,大模型這件事情會特別費錢,因為一般的公司不可能做大模型基座,動不動幾萬張卡、大量的數(shù)據(jù)訓練等。
“所以我們會認為AI大模型國內(nèi)未來就算做出來,成本也會很高。每一次詢問和分析輸出結(jié)果,代價太大了。在農(nóng)業(yè)里,我雇一個員工可能3000-5000元每月。但可能問大模型,也會用上三五千塊,還沒人來得靈活,那這個事情就不可能行得通。”極飛無人機的場景里有大量復雜場景需要分析,團隊覺得最終的成本一定遠遠大于雇傭一個人。
彭斌并未完全否定大模型的可能性,但當時覺得離真的落地還有更遠的距離,這個距離可能是三到五年。DeepSeek出現(xiàn)了以后,團隊現(xiàn)在認為這個距離迅速拉近到一兩年了?,F(xiàn)在極飛的判斷是,這件事情無限可能。
彭斌坦言,這個過程確實是過去幾個月帶來的變化,這種變化最大的原因是DeepSeek帶來的大模型平權(quán),這一改變對他本人來說也是很大的刺激。
智能體平臺創(chuàng)企楓清科技的產(chǎn)品也接入了DeepSeek大模型,創(chuàng)始人兼CEO高雪峰對記者表示,在R1推出了之后,團隊先后在自身的測試環(huán)境以及客戶環(huán)境中進行了部署和適配,他認為,R1 模型展現(xiàn)出的明顯優(yōu)勢是,性能突出和高性價比。
高雪峰認為,R1推出時,在性能效果上的表現(xiàn)、推理能力,特別是在某些應用場景中,已可與國際領(lǐng)先的閉源模型一較高下。其相對較低的推理成本,以及蒸餾出來的各種尺寸的中小模型,對于客戶和市場具有強大的吸引力。DeepSeek 模型顯著降低了大模型的本地化部署的復雜度與成本。
影像企業(yè)美圖在去年12月就部署了DeepSeek,當時他們將DeepSeek用到了美圖設(shè)計室的LivePPT功能上,也為AI口播視頻制作工具開拍接入了DeepSeek。他們發(fā)現(xiàn),DeepSeek對PPT邏輯的理解和AI腳本的撰寫幫助很大。
在采訪中,美圖創(chuàng)始人、董事長吳欣鴻對第一財經(jīng)提到,相比其他開源模型, DeepSeek在中文的理解上會更好。其次,DeepSeek的工程優(yōu)化做得非常極致,推理速度很快,成本很低,這實際上是很多公司切換成DeepSeek一個重要的原因。
吳欣鴻認為,DeepSeek會帶來一些更宏觀的影響,某種意義上它成為了行業(yè)的共識,從大廠到小企業(yè)都在接入,一個事實上的標準。“有了這個標準,比百模大戰(zhàn)、千模大戰(zhàn)要好,就像以前的移動操作系統(tǒng)里一旦有一個很強的產(chǎn)品出現(xiàn),大家就可以放心用,而不用糾結(jié)到底用什么。”
其次,DeepSeek確實讓AI走進了大眾,這個很關(guān)鍵,“AI不能是陽春白雪,必須讓普通人都能用上,而DeepSeek的出現(xiàn)讓我們看到很多人用起來了,他們可能是第一次用AI助手,感受AI的魅力。”這一意義重大。
“買菜無需豪華車”
盡管DeepSeek效果很好,但在應用場景里單一模型也并非所有情況下的最優(yōu)選。商業(yè)化面臨的一個選擇是,在不同場景里挑選性價比最高的模型“應答”。如果追求大參數(shù)量的滿血版本,用戶是否會為模型更高的成本買單?這是商業(yè)化需要考慮的核心問題。
在蜜度,內(nèi)部曾花了一兩周的時間去驗證 DeepSeek在公司業(yè)務場景的表現(xiàn),在智能辦公、智能客服、城市治理這類不同場景下,同時測與DeepSeek同類型同等參數(shù)量的其他解決方案模型。
劉益東對第一財經(jīng)表示,基本上DeepSeek帶思維鏈或者深度思考的R1滿血版本,效果要優(yōu)于原來的解決方案里不帶深度思考的版本。而原來方案里采用的模型的表現(xiàn),可能要略好于DeepSeek同類型參數(shù)不帶深度思考的版本。他強調(diào),這是在公司的業(yè)務場景里,積累下來的數(shù)據(jù)集跑出來的結(jié)果,并不代表所有應用。
與此同時,這帶來的一個問題是,雖然帶深度思考的模型會優(yōu)于其他版本,但算力成本和時間成本都會高不少。“問一個問題,以前模型秒回應,但深度思考就需要過程輸出,另外模型輸出的思維鏈是要消耗token成本的,如果開啟深度思考,一個問題給到模型,假設(shè)輸出2000個token,那不開啟深度思考,可能500個token就夠了。”劉益東解釋。
DeepSeek目前主要有兩個最新的模型,一個是推理模型R1,也就是有思維鏈的深度思考模型,消耗更多的token、更多的時間帶來更加詳細的回答,另外一個則是基礎(chǔ)的V3模型,用更少的token和更快地響應,帶來更簡單的回答。這是不同的兩個技術(shù)路線,在應用場景里用來解決不同深度的問題。除這兩個模型之外,在應用中還可以選擇DeepSeek不同參數(shù)量的蒸餾版模型,減少部署成本。
除了調(diào)用API的模式外,私有化部署也存在用不同模型成本的問題。
任世杰提到,“不見得部署自己的模型,就非要是滿血版的。”他表示,有客戶看到單機就可部署DeepSeek 671B滿血版本的模型,就也要滿血版,但沒有考慮到,單機部署雖然把這些模型容納進去,但實際使用中能并發(fā)出來的模型專家數(shù)量也就8個到10個,利用率會變得非常低。
“將選模型的問題看作是買車的話,如果需求更多是買菜、送孩子上學,那沒必要買一輛豪華跑車。”中國人民大學校級計算平臺負責人、高級工程師魯蔚征認為,雖然豪華跑車更好,安全性或者榮譽感都很好,但是帶來的成本也會很高,同時還有維護成本。
對于這個問題,超聚變AI首席結(jié)構(gòu)師趙迪的觀點是,滿血版大模型是綜合能力強,每一個細分場景都能取得一個不錯的分數(shù)。如果場景或者行業(yè)的屬性不明確的情況下,預算又不受限制,滿血版部署會更好。但業(yè)務如果具體到細分領(lǐng)域,專業(yè)訓練的小模型一定是更好的選擇。
實際上,大部分業(yè)務部署必須要考慮成本的問題。“現(xiàn)在因為DeepSeek剛火不久,大家都是先去擁抱DeepSeek的生態(tài)。越往后業(yè)務量起來之后,推理的請求多了之后,算力成本或者推理成本是不是能接受得了,這是一個比較大的問題。”UCloud優(yōu)刻得華北解決方案架構(gòu)師馬杰提到。
這個問題放在手機廠商這里,為了做到性能和成本的平衡,OPPO系統(tǒng)團隊在做的是“意圖分流”。陳希提到,OPPO ColorOS會做一個系統(tǒng)級的AI,和多個大模型進行合作,除了DeepSeek,還有其他視覺大模型、聲音大模型以及其他多模態(tài)的模型,系統(tǒng)要把這些模型整合在一起。
“我們的挑戰(zhàn)就是要把這種不同能力類型的模型整合成一個用戶體驗,到用戶層面上,他使用的是一個產(chǎn)品,這個很重要。”陳希發(fā)現(xiàn),用戶場景里不同用戶的需求非常繁雜,這背后涉及的是復雜的技術(shù)問題,要不斷進行調(diào)試。
“假如用戶問一個很簡單的問題,今天天氣怎么樣,也許不需要用到大模型,不需要調(diào)用很多操作、消耗算力,就能達成結(jié)果,這個時候怎么能從用戶的意圖分流上,把這一類的問題分流成所謂的簡單問題,從而減少調(diào)用,這就是在系統(tǒng)層面上未來要去持續(xù)構(gòu)建的意圖分流框架。”陳希解釋,在進行分流后,一方面是大幅度降低成本,另外也能夠更精準地去判斷用戶意圖,帶來更準確的答案,不是每個問題都需要“長篇大論”。
在DeepSeek的應用端,這個選擇題實際上是留給了用戶,用戶可以在界面選擇“深度思考R1”版本,或者“聯(lián)網(wǎng)搜索”來讓模型解答自己的問題,相當于提前做了分流。但陳希認為,在手機系統(tǒng)里,這種問題不應該留給用戶,“用戶去想用什么方法解決問題,本身也是一種復雜,我們更想把這個復雜留給自己,那么技術(shù)就要去判斷用戶的意圖”。
除了模型整合上的挑戰(zhàn)外,在手機系統(tǒng)上,用模型做一些更復雜的應用同樣還存在難題。例如,谷歌曾于去年發(fā)布 AI 智能體項目Project Astra,可以通過手機攝像頭與大模型進行實時的視覺與語音交互,在今年3月底終于上線,但也并未完全開放。
陳希認為,視頻對話這樣的場景會更復雜,怎么能讓技術(shù)的嘗鮮變成用戶場景的常用,這一步比較困難的是要做大量泛化的努力。這本質(zhì)上還是技術(shù)的問題,因為現(xiàn)在的技術(shù)并不能充分滿足各種各樣的應用場景,用戶場景是復雜的、千變?nèi)f化的,有可能在車上晃來晃去,有可能在暗光環(huán)境下看不清楚,都會對技術(shù)的可靠性造成很大影響,而現(xiàn)有的技術(shù)還不能完全泛化地去處理所有產(chǎn)品,這也是OPPO仍然在探索的方向。
除了一些技術(shù)的挑戰(zhàn)外,不少從業(yè)者都提及的一個點是,客戶內(nèi)部的數(shù)據(jù)源質(zhì)量會決定企業(yè)能否將大模型的潛力挖掘出來。
在實際項目落地中,馬杰發(fā)現(xiàn)很多用戶數(shù)據(jù)的質(zhì)量是參差不齊的,存在錯誤或者偏離,模型最終輸出的結(jié)果、訓練效果都不是特別理想,尤其在金融、醫(yī)療等領(lǐng)域,對數(shù)據(jù)的安全性、私密性和準確度要求較高,也會存在不同格式的數(shù)據(jù),質(zhì)量也不一樣。適配業(yè)務的時候,需要大量的清洗和預處理的工作。
“之前接觸的一個定制類項目,客戶的數(shù)據(jù)分類有很多,如圖片、音頻、文檔、流程圖,會涉及多個模型和業(yè)務的結(jié)合,數(shù)據(jù)的轉(zhuǎn)化降噪,清洗等工程量也非常大。”馬杰表示,模型落地如果要達到一個很好的效果,對客戶數(shù)據(jù)的質(zhì)量要求很高。
拋開具體業(yè)務層面的難題,趙迪認為,落地中一個更核心的問題是,企業(yè)機構(gòu)擁抱AI的決心有多大,相應的業(yè)務流程和組織結(jié)構(gòu),是否會根據(jù)新的技術(shù)進行調(diào)整。他發(fā)現(xiàn),現(xiàn)在的客戶部分是因為DeepSeek比較火,需要“嘗一下鮮”,但實際上,公司整個業(yè)務流程和組織結(jié)構(gòu)還需要做好準備。
AI是年度報告提及的重點。
人工智能的迅猛發(fā)展引發(fā)了對人類價值和尊嚴的深刻思考,如何界定人與機器的本質(zhì)區(qū)別成為關(guān)鍵問題。
向老師學習,老師的智能就是天花板;向自然學習,就可以突破人類智能的極限。所以AI的優(yōu)勢在可擴展性,它發(fā)展的絕對瓶頸常在數(shù)據(jù)和能源。
國資委:中央企業(yè)人工智能產(chǎn)業(yè)發(fā)展將進一步提速加力;阿里巴巴蔡崇信:開始看到人工智能數(shù)據(jù)中心建設(shè)出現(xiàn)泡沫。
怎么才能用好如今“百模大戰(zhàn)”之下各種層出不窮的AI模型?關(guān)鍵就是要分清楚它們所處的層次,以匹配你想達到的目的。