分享到微信打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
(本文作者朱一峰,中央財(cái)經(jīng)大學(xué)金融學(xué)院副教授)
一、ChatGPT及AI大模型介紹
2022年11月30日,OpenAl發(fā)布大語(yǔ)言模型ChatGPT,其上線5天用戶數(shù)量過(guò)百萬(wàn)、2個(gè)月吸引活躍用戶過(guò)億的成績(jī),一度刷新紀(jì)錄,成為史上增長(zhǎng)最快的應(yīng)用。
ChatGPT的爆火使人工智能(AI)再次闖入大眾視野,并使其與人們的工作生活相結(jié)合。人工智能的概念最早可以追溯到20世紀(jì)50年代,當(dāng)時(shí)計(jì)算機(jī)科學(xué)的先驅(qū)們開(kāi)始探索機(jī)器模擬人類智能的可能性。1956年,在達(dá)特茅斯會(huì)議上,這個(gè)領(lǐng)域被正式命名為“人工智能”。早期的研究集中在邏輯推理和問(wèn)題解決上,但很快人們意識(shí)到,要讓機(jī)器真正智能,就必須讓它能夠理解和生成自然語(yǔ)言。
ChatGPT“無(wú)比強(qiáng)大”的能力主要得益于其依托的大型語(yǔ)言模型。最初,自然語(yǔ)言處理(NLP)相關(guān)研究主要通過(guò)編寫(xiě)語(yǔ)法規(guī)則和詞典來(lái)進(jìn)行句子分析。20世紀(jì)80年代,隨著計(jì)算能力的提高和大量語(yǔ)料庫(kù)的出現(xiàn),統(tǒng)計(jì)方法逐漸占據(jù)主導(dǎo)地位,這一時(shí)期,許多基于統(tǒng)計(jì)的機(jī)器翻譯、分詞、詞性標(biāo)注等方法相繼出現(xiàn)。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,人工神經(jīng)網(wǎng)絡(luò)和其他機(jī)器學(xué)習(xí)方法已經(jīng)在自然語(yǔ)言處理領(lǐng)域取得了重要的進(jìn)展。從循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)到長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)的語(yǔ)言模型,到以Transformer為基礎(chǔ)架構(gòu)的大模型,語(yǔ)言模型性能不斷提升,并逐步實(shí)現(xiàn)了文本情感分析、自然語(yǔ)言推斷、對(duì)話問(wèn)答、上下文學(xué)習(xí)和程序代碼生成等能力。尤其是Transformer模型的誕生改寫(xiě)了語(yǔ)言模型構(gòu)建方式,它通過(guò)自注意力機(jī)制實(shí)現(xiàn)了對(duì)長(zhǎng)序列的有效處理,極大地提高了語(yǔ)言模型的性能,后續(xù)各大主流模型也都是在Transformer模型的基礎(chǔ)上不斷發(fā)展。
ChatGPT的橫空出世,不僅標(biāo)志著人工智能大模型時(shí)代的到來(lái),更是揭開(kāi)了通用人工智能(AGI)探索的新篇章。回顧C(jī)hatGPT的發(fā)展歷程可知,美國(guó)人工智能實(shí)驗(yàn)室OpenAI自GPT-1開(kāi)始,就將大型語(yǔ)言模型視為通往通用人工智能的必由之路。從GPT-1到GPT-4,OpenAI的GPT系列模型不斷推陳出新,每代模型的參數(shù)規(guī)模都比前一代大一個(gè)數(shù)量級(jí),GPT-4的模型參數(shù)已達(dá)1.8萬(wàn)億。模型不僅在語(yǔ)言理解和推理能力上逐步提升,還特別針對(duì)交互提升了其對(duì)話能力,并在第4代模型增加了圖像輸入的形式。2024年5月14日OpenAI新發(fā)布了GPT-4o模型,其性能在GPT-4基礎(chǔ)上再度升級(jí)。該模型跨文本、視覺(jué)和音頻端到端訓(xùn)練,所有輸入和輸出都由同一個(gè)神經(jīng)網(wǎng)絡(luò)處理,提升響應(yīng)速度的同時(shí),也展現(xiàn)了未來(lái)大模型向多模態(tài)方向的發(fā)展趨勢(shì),進(jìn)一步加快了向通用人工智能邁進(jìn)的速度。
國(guó)際大模型發(fā)展如火如荼的同時(shí),國(guó)內(nèi)也在奮力追趕,發(fā)展迅速。國(guó)內(nèi)大模型與GPT-4差距快速縮小,第一梯隊(duì)的頭部大模型例如ChatGLM4、百度文心一言4.0、訊飛星火V3.5整體表現(xiàn)已經(jīng)接近GPT-4,在中文領(lǐng)域,國(guó)內(nèi)部分模型表現(xiàn)已經(jīng)可以比肩GPT-4。
ChatGPT能夠成為新一代人工智能里程碑,離不開(kāi)算力的支持。比如ChatGPT使用的GPT-3.5模型依靠微軟云計(jì)算進(jìn)行訓(xùn)練,總算力消耗約3640 PF-days(即按每秒一千萬(wàn)億次計(jì)算,運(yùn)行3640天)。由此帶來(lái)一個(gè)問(wèn)題,由于訓(xùn)練和運(yùn)行模型均需要龐大的算力,資金消耗也加大了公司成本端壓力。近年來(lái),隨著模型規(guī)模的不斷擴(kuò)大,訓(xùn)練成本也在不斷增加。2017年Transformer模型訓(xùn)練成本約為930美元。到了2023年,OpenAI的GPT-4和Google的Gemini Ultra的訓(xùn)練成本預(yù)計(jì)分別約為7800萬(wàn)美元和1.91億美元。
OpenAI作為大模型賽道目前的領(lǐng)跑者,其商業(yè)模式主要分為三部分:用戶訂閱、開(kāi)發(fā)者付費(fèi)和微軟分成。首先,從2023年年初開(kāi)始,OpenAI就推出了會(huì)員訂閱服務(wù),每月收取20美元,到去年7月付費(fèi)用戶已超200萬(wàn)。其次,開(kāi)發(fā)者API接口收費(fèi)是OpenAI最核心的收入,這種模式下開(kāi)發(fā)者通過(guò)大模型滿足自身垂直的應(yīng)用場(chǎng)景,而OpenAI根據(jù)流量計(jì)費(fèi)。第三部分來(lái)自于OpenAI與微軟的合作分成,向企業(yè)端客戶售賣Azure OpenAI云大模型。成功的商業(yè)模式探索為公司帶來(lái)了可觀的收入,2022年OpenAI還面臨5.4億美元的虧損,到2023年公司收入已超過(guò)16億美元。
不過(guò),為大眾構(gòu)筑起對(duì)人工智能美好前景的期待或許才是OpenAI成功的主要原因,相較之下,商業(yè)模式的選擇屈居其次。AI領(lǐng)域仍存在無(wú)數(shù)掙扎在生死線上的AI模型公司,如何探索出屬于自己的商業(yè)化道路是他們面臨的重要難題。
二、ChatGPT等一眾AI怎樣賦能金融業(yè)
銀行業(yè)的AI應(yīng)用方興未艾,銀行業(yè)旺盛的數(shù)字化轉(zhuǎn)型需求使國(guó)內(nèi)外銀行紛紛布局智能客服、智能數(shù)據(jù)助理、智能評(píng)級(jí)、智能風(fēng)控等領(lǐng)域。
投資機(jī)構(gòu)對(duì)ChatGPT的態(tài)度則較為謹(jǐn)慎。此前廣受關(guān)注的智能投顧、AI×量化投資等AI×金融模式尚未得到廣泛應(yīng)用,不過(guò),目前國(guó)內(nèi)外學(xué)者已經(jīng)發(fā)現(xiàn)ChatGPT不僅僅是工具,更具有指導(dǎo)量化交易的能力。今年3月,Sangheum和Cho的研究發(fā)現(xiàn)ChatGPT能夠根據(jù)輸入的推特新聞生成買入和賣出的股票代碼,并獲得正收益。他們還發(fā)現(xiàn),這一結(jié)果似乎說(shuō)明ChatGPT能夠處理大量的非公司特定新聞,并據(jù)此生成公司特定交易信號(hào)。
在金融科技領(lǐng)域,繼彭博社于2023年3月率先推出金融垂直大模型BloombergGPT后,國(guó)內(nèi)外涌現(xiàn)了一批金融垂直大模型。與通用大模型相比,金融垂直大模型更能適應(yīng)金融行業(yè)合規(guī)要求嚴(yán)、精度要求高、風(fēng)險(xiǎn)厭惡的特征。
三、AI×金融的未來(lái)與建議
從宏觀層面看,AI×金融是金融機(jī)構(gòu)未來(lái)幾年戰(zhàn)略布局的關(guān)鍵。被視為“新質(zhì)生產(chǎn)力的重要引擎”的AI技術(shù),未來(lái)將作為數(shù)字金融的底座和能力與中央強(qiáng)調(diào)的金融“五篇大文章”深度融合。
在金融監(jiān)管領(lǐng)域,AI既是監(jiān)管手段,也是監(jiān)管目標(biāo)。目前,金融領(lǐng)域的AI應(yīng)用存在的問(wèn)題主要有二,在技術(shù)層面,第一,作為合規(guī)要求嚴(yán)格的服務(wù)業(yè),金融怎樣降低AI輸出“有毒內(nèi)容”帶來(lái)的風(fēng)險(xiǎn)。第二,有著嚴(yán)格保密要求的金融業(yè),在AI時(shí)代怎樣保護(hù)數(shù)據(jù)隱私。因此,全新的AI×金融模式,也需要全新的監(jiān)控手段與之匹配。AI能夠快速?gòu)亩嗲阔@取大量多元化數(shù)據(jù),從而有助于全方位形成監(jiān)管合力,實(shí)現(xiàn)發(fā)展與監(jiān)管的“同步化”。
從金融行業(yè)的細(xì)分領(lǐng)域看,以ChatGPT為首的一眾AI大模型將會(huì)逐漸與各領(lǐng)域業(yè)務(wù)深度融合。在研究領(lǐng)域,ChatGPT的最新版本GPT-4o引入了數(shù)據(jù)文檔在線分析功能,能夠直接上傳Excel進(jìn)行分析。分析師不再需要手動(dòng)輸入Excel函數(shù)或自行編寫(xiě)代碼,通過(guò)GPT-4o在線分析即可得到大量指標(biāo)。在量化投資領(lǐng)域,ChatGPT將不僅僅作為解放生產(chǎn)力的工具,幫助量化從業(yè)者減少基礎(chǔ)性工作耗費(fèi)的時(shí)間精力,還能夠通過(guò)大模型耦合以及大模型涌現(xiàn)等方式優(yōu)化量化投資的邏輯。在未來(lái),ChatGPT及各類AI大模型能夠承擔(dān)的分析輔助功能或?qū)⒏訌?qiáng)大,如李聞一等(2024)提出ChatGPT+RPA能夠?qū)崿F(xiàn)兩融業(yè)務(wù)擔(dān)保資產(chǎn)的風(fēng)控,可見(jiàn)ChatGPT在金融領(lǐng)域的應(yīng)用還有更多拓寬、深入的空間。
參考文獻(xiàn):
[1]2024 AI Index Reporthttps://aiindex.stanford.edu/report/
[2]從GPT-1到ChatGPT及最新的GPT-4,GPT系列技術(shù)的發(fā)展過(guò)程https://blog.csdn.net/hawkman/article/details/130100177
[3]2023年狂賺16億美元后,OpenAI還會(huì)繼續(xù)火下去嗎? https://www.woshipm.com/ai/5975746.html
[4]朱光輝, 王喜文. ChatGPT的運(yùn)行模式、關(guān)鍵技術(shù)及未來(lái)圖景[J]. 新疆師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版), 2023, 44(04):113-122.
[5]讓AI從“用起來(lái)”到“有價(jià)值”,火山引擎的金融大模型是怎么煉成的?https://mp.weixin.qq.com/s/BeRfr-y_pXuVb8j1cdyt0A
[6]【AI金融新紀(jì)元】系列報(bào)告(二)——AI+金融大模型的兩條技術(shù)路線https://mp.weixin.qq.com/s/YJSPi9YUs9rm0OqZoKNEdA
[7]ChatGPT在金融中的應(yīng)用https://mp.weixin.qq.com/s/CGEy7Da4hcwtDX_jsPdqFw
[8]人人都能成為金融分析師:AI助你輕松分析股價(jià),快速掌握股市波動(dòng)趨勢(shì)https://mp.weixin.qq.com/s/uzmmjotxb1i4BzH2iKkdQg
[9]Cho, Sangheum, Can ChatGPT Generate Stock Tickers to Buy and Sell for Day Trading? (March 14, 2024), https://ssrn.com/abstract=4759311
[10]益言, 2023. 人工智能在金融領(lǐng)域的應(yīng)用及監(jiān)管進(jìn)展[J].中國(guó)貨幣市場(chǎng), 2023(12):71-76.
[11]李聞一, 黃怡凡, 錢磊, 2024. 基于ChatGPT+RPA的融資融券業(yè)務(wù)擔(dān)保資產(chǎn)風(fēng)險(xiǎn)評(píng)價(jià)[J]. 會(huì)計(jì)之友, 2024(2):88-94.
(朱一峰為中央財(cái)經(jīng)大學(xué)金融學(xué)院副教授;湯佳怡為中央財(cái)經(jīng)大學(xué)金融學(xué)院研究生;趙霆鈞為中央財(cái)經(jīng)大學(xué)金融學(xué)院研究生)
本文僅代表作者觀點(diǎn)。
OpenAI創(chuàng)始人Sam Altman:將在幾周內(nèi)發(fā)布o(jì)3、o4-MINI;谷歌宣布一個(gè)新的實(shí)驗(yàn)性人工智能模型Sec-Gemini V1。
有的LP希望賺取高確定性的盈利,有的LP追求技術(shù)創(chuàng)新的長(zhǎng)線投資。
“應(yīng)用為王”這一理念在大模型技術(shù)發(fā)展與落地中尤為重要,已經(jīng)成為產(chǎn)業(yè)界、企業(yè)界最迫切解決的一個(gè)課題。
螞蟻?zhàn)匝?900億大模型用國(guó)產(chǎn)AI芯片完成高效訓(xùn)練;京東入局具身智能,已成立多支團(tuán)隊(duì)進(jìn)行前沿研發(fā)。
怎么才能用好如今“百模大戰(zhàn)”之下各種層出不窮的AI模型?關(guān)鍵就是要分清楚它們所處的層次,以匹配你想達(dá)到的目的。