分享到微信打開微信,點擊底部的“發(fā)現(xiàn)”, |
轟轟烈烈的2023年AIGC元年結束了,心情有點復雜。
在國內,和年初ChatGPT炸雷帶來的全民興奮相比,AI并沒有給普通人的生活帶來多少改變。
AI——這個當之無愧的下一代信息技術革命,沒像上一波移動互聯(lián)網(wǎng)浪潮中的微信和滴滴打車,在一年里實現(xiàn)“一夜春風來、萬樹梨花開”式的商業(yè)滲透。認真使用AI工具的人不多,現(xiàn)象級的AI產(chǎn)品完全沒有出現(xiàn)。
在海外,ChatGPT以迅雷不及掩耳的速度斬獲1.8億用戶,AI繪圖軟件MidJourney獲得超1500萬用戶和數(shù)億美元營收;微軟的GitHub編程助手Copilot在9月份付費用戶已超百萬,多個小型APP號稱獲得數(shù)百萬美元的訂閱收入。
在硅谷和華爾街,逢人必談AI。美股在AI芯片霸主英偉達和AI應用先鋒微軟的帶領下,日日創(chuàng)出新高。
不夸張地說,若無AI,美國可能已陷入經(jīng)濟衰退;有了AI,美國走在了新一輪泡沫的路上。
比爾·蓋茨認為:在像美國這樣的高收入國家,距離普通大眾使用人工智能達到顯著水平還有18到24個月的時間。在非洲,他預計在三年左右會看到類似的使用水平。據(jù)此預測,2024年美國會達到人工智能的“普惠”狀態(tài)。
中國和美國的人工智能差距正在拉大。由于對英偉達GPU的禁令,全世界最緊俏的商品變成了英偉達的GPU或平替,甚至有人不恰當?shù)匕袵PU比作超過毒品的新一代最暴利走私品。
和爭奪土地、石油、黃金的戰(zhàn)爭一樣,人工智能算力、算法變成了大國軍備的新戰(zhàn)場,也成為企業(yè)家和創(chuàng)業(yè)者的兵家必爭之地。
時不我待,何以勝出?下文我主要采用AI在醫(yī)療、金融等嚴肅領域的實際需求案例,探討AI在2024年從技術到產(chǎn)品商業(yè)落地的10個方向:
1. 更強的多模態(tài)交互
2. 可解釋性更強的人工智能
3. 更強的搜索增強生成
4. 構造自動代理生態(tài)
5. 更強、更經(jīng)濟節(jié)能的算力
6. 更快的AI平民化進程
7. AI與Web3結合的破局
8. 打磨用戶需要的“小”產(chǎn)品
9. AI能力帶入數(shù)據(jù),而不是相反
10. 獲取用戶對AI的信任
更強的多模態(tài)交互
多模態(tài)交互類似于人類的多維感官能力。多模態(tài)人工智能可以交叉處理和分析文本、圖像、語音多種數(shù)據(jù)類型。這種融合不同模式的方法使機器能夠全面、立體地理解世界。
在去年圣誕節(jié),很多賀卡由AI生成。這是從文字生成的圖片和視頻。從文字生成音樂和歌曲還不成熟。GPT4.0的語音對話相當給力,可以直接用中文和它對話。
以醫(yī)療領域的需求看,病人拿到血常規(guī)或腫瘤指標檢查報告,想知道異常指標的意義。多模態(tài)技術的發(fā)展,可以讓用戶拍照上傳檢查報告,AI識別照片中的指標、搜索知識庫、給出每個指標的含義,然后用語音告訴可能的診斷。這種體驗太棒了。
在金融領域,如果上傳一張K線圖,AI就能識別出其形態(tài),極大地提升技術分析投資者的效率。在芯片設計或建筑設計領域,如果能讓AI讀懂設計圖,再設計出新的設計圖,那就更厲害。
在非嚴肅領域,多模態(tài)會大大提高數(shù)字形象、短視頻制作的效率,豐富這些應用的使用場景。
可解釋性更強的人工智能
可解釋的人工智能的目標在于提高AI決策過程的透明度和可理解性,從而能夠更好地理解AI如何作出決策。
當前的AI決策過程往往被視為一個“黑盒”,用戶無法了解模型得出結論的內在邏輯。無法被解釋的決策過程,不可能在嚴肅商業(yè)領域獲得信任。
AI看完檢查報告,可以給出用藥建議。如果不知道這個用藥建議基于何種知識,也不知道AI作出推理和判斷的過程,相信沒有人敢用AI開出的藥方。生命不能做AI概率游戲的試驗品。
現(xiàn)舉例說明。我問ChatGPT:“如果換算成特斯拉的行駛里程,7200兆瓦時可以行駛多少公里?”
AI會告訴我它的邏輯——為了估算7200兆瓦時(MWh)的電能可以讓特斯拉汽車行駛多少公里,我們需要知道特斯拉汽車的能源效率。以特斯拉Model 3為例,其能源效率大約為15千瓦時/100公里(即0.15千瓦時/公里)。
我們可以通過以下公式計算行駛里程:總行駛里程=總電能(千瓦時)/每公里耗電量(千瓦時/公里)
現(xiàn)在我們可以計算7200兆瓦時(即7200000千瓦時)可以讓特斯拉汽車行駛多少公里。我將進行計算(此處,AI寫Python代碼進行計算)。
使用7200兆瓦時的電能,一輛特斯拉Model 3理論上可以行駛約4800萬公里。
以上,AI展示了一個完整的、可解釋的AI推導。用戶可以對每一步檢查、糾錯。
AI在嚴密的數(shù)學推理已經(jīng)取得某些突破。近期,數(shù)學大神陶哲軒成功地用AI工具完成了形式化多項式Freiman-Ruzsa猜想證明過程的工作。陶哲軒大聲呼吁,數(shù)學家一定要會用AI。
可解釋的人工智能的實現(xiàn)需要開發(fā)新的算法和工具,通過可視化技術、自然語言解釋或簡化決策邏輯的表示,以提供關于AI決策過程的深入洞察。
綜上,可解釋的人工智能在醫(yī)療、科學研究等嚴肅領域具有巨大的商業(yè)應用價值。在這些領域,決策的透明度和可信度至關重要,AI的大規(guī)模嚴肅應用必須在較高的置信度上給客戶以流程控制和質量控制的選項和權利。
更強的搜索增強生成
搜索增強生成(RAG)是一種結合了信息檢索和文本生成的AI技術。它旨在通過從“外部”數(shù)據(jù)源檢索信息來增強和改善生成模型的輸出質量。
RAG使得大型語言模型能夠訪問外部信息,幫助它們產(chǎn)生更準確、更具上下文意識的回應,其目標在于提高語言模型生成內容的準確性和相關性。
在RAG系統(tǒng)中,當模型接收到一個查詢時,首先執(zhí)行一個檢索步驟,查找與查詢相關的信息。然后,這些相關信息被融入生成過程,實現(xiàn)生成內容準確性和相關性的顯著改善。
以病人的需求為例,我的朋友曾親自嘗試ChatGPT 4.0搜索增強的能力。病人在服藥后發(fā)生間歇性尿失禁,但尿失禁到底是不是服藥的不良反應呢?在藥品說明書上找不到,醫(yī)生也不確定。
朋友最初給AI的問題是“卡培他濱的副作用是否包含尿失禁?”
AI的回答是:“尿失禁不是通常與卡培他濱直接關聯(lián)的副作用??ㄅ嗨麨I的副作用通常包括胃腸道癥狀,如腹瀉、惡心、嘔吐和口腔潰瘍等。尿失禁可能是由其他因素引起的,如泌尿系統(tǒng)的問題、藥物的其他副作用、或是與患者的整體健康狀況相關。”
如果把提問改成:“搜索英文專業(yè)醫(yī)學資料,卡培他濱的副作用是否包含尿失禁”,AI開始自動用Bing搜索互聯(lián)網(wǎng),然后它真的搜到了多個醫(yī)學文獻。
AI說:“根據(jù)我找到的英文專業(yè)醫(yī)學資料,尿失禁被列為卡培他濱的罕見副作用之一,發(fā)生率在0.01%到0.1%之間。這表明尿失禁確實可能是卡培他濱使用的潛在副作用,盡管它并不常見?!?/p>
AI可以給出它得出這個結論的多個可靠信息來源。AI如何搜索到這些信息、如何加快搜索的速度、如何綜合多個搜索結果做出推理和結論,是更強的增強搜索要做的事情。
RAG在企業(yè)級商業(yè)應用中具有顯著優(yōu)勢。因為在面向客戶的場景中,生成內容的準確性至關重要。RAG能夠減少生成型AI中的“幻覺”問題。“幻覺”指的是生成聽起來合理但實際上是錯誤的回答。在信息不對稱領域,用戶不能判斷幻覺內容的對錯。這導致AI的應用受限。
此處說一個題外話,為什么上面的例子需要指明搜索“英文”專業(yè)醫(yī)學資料?因為在某些不指明英文的情況下,Bing搜索引擎用中文搜索,在中文互聯(lián)網(wǎng)上找不到匹配的關聯(lián)信息。如果用最常用的某中文搜索引擎搜索,搜索到的結果大部分是廣告和商業(yè)網(wǎng)站上意義不相關的信息。
中文搜索引擎和中文互聯(lián)網(wǎng)的質量堪憂是AI發(fā)展的重大問題之一。因此,和大模型相比,想辦法打造更強的搜索增強生成技術,也許是在中文互聯(lián)網(wǎng)開發(fā)產(chǎn)品制勝的關鍵。
構造自動代理生態(tài)
上面搜索增強生成的討論,已經(jīng)包含了自動代理的部分功能。
當AI經(jīng)過自我學習和模型升級,當它了解到我總在搜索專業(yè)文獻后,當我再次詢問藥物副作用同樣模式的問題時,AI會自己啟動搜索專業(yè)互聯(lián)網(wǎng)的動作,而不需要我再做指示。就像我的秘書了解我的習慣、不需要我吩咐就把事情做了一樣。這是自動代理的用例之一。
自動代理是一種能夠自動獨立執(zhí)行任務和作出決策的AI系統(tǒng)。這些代理展現(xiàn)了一定程度的自主性和主動性,能夠理解其所處的環(huán)境、設定目標,并采取行動實現(xiàn)目標,不再需要人類額外指導。
有一個開源項目叫AutoGPT,它自動分解任務的動作,然后自動分步執(zhí)行,就像自動執(zhí)行上面的搜索任務一樣。
自動代理在多個領域具有廣泛的應用前景。
2024年的訂外賣服務也許會變成:你只要和AI說中午訂三份我常吃的外賣和客戶一起吃,不要辣。AI會自動分析你常吃的外賣、剔除辣的;它知道你是和客戶吃,要吃好一點、貴一些;它根據(jù)送達的時間和午餐的時間選擇商家,然后自動買一份準時達保險。這些步驟在幾秒內自動完成。
不止訂餐服務,個人日常助理會是自動代理的一個重要應用場景。如果蘋果在2024年入局AI,Siri會變成一個更高級的自動代理。
自動代理和硬件結合,會有新的產(chǎn)品形態(tài)。使用AI加持的蘋果公司會是自動代理領域最有實力的競賽選手。
Humane公司開發(fā)的AI Pin是由Sam Altman支持的創(chuàng)新型可穿戴人工智能設備。AI Pin可以夾在衣服上,像校徽一樣。它能夠響應觸摸、語音指令和手勢,主要用于搜索和翻譯信息、導航等功能,通過語音和AI聊天機器人來交流信息。這款產(chǎn)品預計將在2024年3月開始向消費者發(fā)貨。
這意味著:未來的每個人都可以有一個隨身攜帶的小秘書,它記錄你的會議、見聞、聊天、思想,隨叫隨到,直到復制出你的數(shù)字生命,就像電影《流浪地球》里的數(shù)字生命一樣。
顯然,自動代理需要完整的閉環(huán)生態(tài)構建和安全管控,它需要打通交互、采購、物流、支付全環(huán)節(jié)。我相信在2024年,此閉環(huán)生態(tài)將露出雛形,重量級選手會入場。
更強、更經(jīng)濟節(jié)能的算力
當前AI發(fā)展的一個關鍵限制因素是對大量計算資源的需求。這不僅增加了成本,而且導致了巨大的能源消耗。
AI聊天工具導致大型科技公司的水資源使用量劇增。計算產(chǎn)生熱量,進而需要大量水資源冷卻設備。
有數(shù)據(jù)表明,由于AI產(chǎn)品(如ChatGPT)日益受歡迎,微軟的全球水資源使用量增加了超過三分之一,達到了近17億加侖。谷歌的水資源使用量也比前一年增加了大約20%,約為56億加侖。研究員估計,使用GPT回答5到50個問題,大約消耗500毫升的水。
電力方面,根據(jù)估算,訓練GPT4.0耗時150天,耗費電力720萬度電,這些電夠特斯拉行駛4800萬公里。(這個換算是我在上文“可解釋的AI”部分的例子。做任何事情,我都想用AI試試看,不試不知道,一試嚇一跳。)
2024年需要更高效的AI算法以在減少計算資源需求的同時提高模型的性能。硬件方面,業(yè)內也在尋找新的材料和設計,如量子計算,以期實現(xiàn)更高效的數(shù)據(jù)處理、降低能耗。
在芯片禁令下,突破原有技術路徑,尋找升維競爭的突破口,可能是中國企業(yè)的機會。這需要強大的風險投資資本支持。
對GPU的需求剛剛開始。當全球有20%的人,每天使用AI的時候,GPU的需求將增長百倍。美股科技股的天花板還很高。能在中國實現(xiàn)GPU“平替”的企業(yè)可以賺大錢。
更快的AI平民化進程
這又被稱為開發(fā)的民主化。它的含義是,AI的易用性使得人與計算機的深度互動簡單到像聊天一樣,幾乎任何人都能夠成為開發(fā)者。
AI開發(fā)的平民化意義重大。它意味著更多的人可以參與計算機產(chǎn)品的開發(fā),不再局限于專業(yè)技術人員或擁有高級編程技能的人。
我本是一個做投資的,只有20年前大學C語言編程基礎。因小孩喜歡畫畫,被AI繪畫吸引誤入AI的大坑?,F(xiàn)在,我正在用GitHub AI編程助手和ChatGPT,用業(yè)余時間開發(fā)一個功能復雜的AI應用軟件,我絲毫不覺得困難。在我和AI的共同努力下,AI正確寫出了我需要的所有代碼。
AI打破了計算機科學的技術壁壘,其實質是硅基生命向碳基生命敞開心扉,人類用自然語言就可以實現(xiàn)深度計算機技術的實現(xiàn)。
當大量不同背景的人都能參與到這場信息革命的浪潮中,此種多元化的參與帶來了更廣泛的視角和創(chuàng)新的可能性,必然極大加快人類技術爆炸的速度。
其意義重大程度,堪比近1000年來,人類完成的識字掃文盲運動。從第一封電子郵件發(fā)出,到人類普遍掌握互聯(lián)網(wǎng)技能,用了數(shù)十年。而用多模態(tài)技術的交互方式,AI可以用3年時間完成高難度計算機技能向人類白丁的普及,速度加快十倍、百倍。
用戶友好的工具和界面的開發(fā)同樣重要,它們能夠降低AI開發(fā)的復雜性,使其更易于理解和操作。自動化和智能化的開發(fā)工具將極大地減輕人工編程的負擔,提高開發(fā)效率。
預計2024年的AI編程工具將更加強大,平民化的進程會進入加速發(fā)展期。在AI的幫助下,一個沒有編程基礎的普通人可以編寫出任何他想要的應用,如同文字掃盲運動讓普通人不再需要找人代寫信、自媒體技術發(fā)展讓每個人不再需要找期刊投稿就能發(fā)表自己的觀點。
回到醫(yī)療的例子,一個腫瘤病人,有過去30個月每周的檢查結果數(shù)據(jù),他想知道他的腫瘤指標變化的趨勢。這些結果存儲在醫(yī)院的系統(tǒng)里,醫(yī)院的信息系統(tǒng)不對病人提供歷史數(shù)據(jù)摘錄和比較功能。病人或家屬需要手工摘錄出每個異常指標,記錄下來,劃出曲線。有了AI,病人可以讓AI寫一個APP,每周把紙質的檢驗報告拍照上傳,然后AI自動識別結果,并更新畫出變化趨勢圖。
在目前的軟件范式中,用戶需要尋找能滿足自己需求的軟件,軟件開發(fā)者需要在很多人的差異化需求中尋找公約數(shù),小眾用戶的需求不能被滿足。AI平民化將從根本上改變人使用計算機的方式和軟件開發(fā)行業(yè)的商業(yè)圖景。
在AI平民化的浪潮中,中國有可能會尤為被動。在物欲橫流的沖擊下,中國沒有像樣的程序員社區(qū),中國的教育體制培養(yǎng)出的是在AI時代被拋棄的程序員和知識搬運工,有科學鉆研精神的人不多,全民創(chuàng)造力無法被激發(fā)。AI平民化水平低的國家將在未來的生產(chǎn)效率和創(chuàng)造性競爭中,落后于AI平民化水平高的國家。
AI與Web3結合的破局
OpenAI創(chuàng)始人Altman支持的一個Web3項目是WorldCoin。WorldCoin運行在以太坊區(qū)塊鏈上。它要做的是建立一個全球最大、公平的數(shù)字身份驗證體系。為了區(qū)別誰是活人、誰是機器人,WorldCoin通過掃描人眼的虹膜來實現(xiàn)身份認證。到今天,已經(jīng)有數(shù)百萬人主動接受了WorldCoin的眼球掃描。如果不是區(qū)塊鏈和數(shù)字世界的“原住民”,普通人很難理解這個項目的意義何在。
以區(qū)塊鏈技術為基礎的Web3在2022、2023年陷入低谷,Crypto市場處在慢慢熊市的尾端。技術信徒們的創(chuàng)業(yè)熱情從Web3完全轉移到了AI。
區(qū)塊鏈作為數(shù)字世界的“生產(chǎn)關系”基礎設施,和AI作為數(shù)字世界的“生產(chǎn)力”激發(fā)工具,有天生結合點。如果相信硅基生命的未來,硅基生命的載體應該存在于區(qū)塊鏈上。
否極泰來,自2023年11月開始,區(qū)塊鏈資產(chǎn)獲得了巨大漲幅,熱情被重新點燃。2024年,伴隨區(qū)塊鏈市場的復蘇,AI和Web3在去中心化算力、AI經(jīng)濟價值的實現(xiàn)、智能合約自動化與優(yōu)化、去中心化數(shù)據(jù)市場、個人隱私數(shù)據(jù)的使用、AI創(chuàng)作數(shù)字藝術品、數(shù)字孿生等方面,會找到突破點。
值得警醒的是,這種突破將快速產(chǎn)生暴富的機遇和歸零的騙局。
打磨用戶需要的“小”產(chǎn)品
AI時代的大平臺、大公司將壟斷基礎設施,大語言模型的終局只會有2到3家企業(yè)和開源模型。AI創(chuàng)業(yè)者需要認清這個殘酷現(xiàn)實,沒有顛覆性的創(chuàng)新和極強的資本能力、執(zhí)行能力,不要走向“一將功成萬骨枯”路上的“白骨”之一。
基于此邏輯,大型科技公司將在平臺戰(zhàn)斗中鞏固先機。從硬件到軟件,在開發(fā)“+AI”產(chǎn)品的戰(zhàn)役中,大公司的實力明顯。基于此,AI將極大推動全球的資本開支、經(jīng)濟強勢和科技股的牛市。
對應用型開發(fā)創(chuàng)業(yè)者,必須聚焦打磨用戶需要的、完全AI原生的“小”產(chǎn)品。Web 2.0時代燒錢獲得用戶規(guī)模經(jīng)濟的打法不復存在。用戶在APP上任何使用AI的動作,都需要支付費用,沒有人會用免費模式燒這么多錢。
只有打磨出真正客戶需要的產(chǎn)品,幫助客戶提升效率的產(chǎn)品,才是王道。開發(fā)者需要從第一分鐘開始,就有用戶付費意愿認可。這種產(chǎn)品不怕小眾。但是,由于AI開發(fā)平民化的快速發(fā)展,創(chuàng)業(yè)者開發(fā)出成功產(chǎn)品的難度越來越大。
而為了打磨產(chǎn)品,創(chuàng)業(yè)者最重要的能力是把需求產(chǎn)品化的能力,要跟上大平臺快速迭代的AI技術發(fā)展,然后快速而經(jīng)濟地應用到產(chǎn)品需求中。
AI能力帶入數(shù)據(jù),而不是相反
英偉達金融行業(yè)高管認為,隨著人工智能的進步呈指數(shù)級增長,金融服務公司將把計算能力帶入數(shù)據(jù),而不是相反。
并非只在金融行業(yè)。事實上,沉淀在企業(yè)和個人的優(yōu)質數(shù)據(jù)已經(jīng)足夠龐大,問題是如何用AI能力全新地發(fā)揮這些數(shù)據(jù)的生產(chǎn)力。學術期刊數(shù)據(jù)庫《知網(wǎng)》也推出了人工智能助手。開發(fā)者不需要守著金礦向外尋覓。
據(jù)麥肯錫公司稱,像ChatGPT這樣的深度學習算法,經(jīng)過企業(yè)數(shù)據(jù)的進一步訓練,每年可以在63個業(yè)務用例中增加相當于2.6萬億至4.4萬億美元的收入。巨大的金礦等待被挖掘。
開發(fā)者應聚焦用AI加持現(xiàn)存的有價值數(shù)據(jù),滿足用戶的效率要求、讓大數(shù)據(jù)在AI時代的場景中開始賺錢。
獲取用戶對AI的信任
經(jīng)過2023年的新鮮感,見慣了新鮮玩意兒,用戶不想再把AI當玩具,而是想用它實現(xiàn)靠譜的真實價值。即使是情感陪伴機器人,也需要有血有肉有情感的真實體驗。
能率先可控、準確、高質量地按照用戶指示完成任務的AI產(chǎn)品將在2024年獲得大發(fā)展。
與此同時,構建信任需要更多早期用戶擁抱AI的意愿。一件新型事物的普及,如同一個石子投入池塘產(chǎn)生的漣漪。
AI是個新物種,產(chǎn)品開發(fā)人員和用戶都需要學習如何和它相處。此種適應的過程需要工作方式、思維模式的根本轉變。
比如,我寫本文的傳統(tǒng)方式是:閱讀已有的AI技術和商業(yè)方向文章,加入個人思考,然后在文章末尾加上無足輕重的參考文獻。而用AI寫文章的方式可把順序完全顛倒過來:先從參考文獻開始,讓AI閱讀并寫出參考文獻的要點,我再取其精華,加入個人的思考。
這會不會涉及版權和“洗稿”呢?我認為,不管人還是AI,判斷是否有價值內容的金標準是“獨立而有價值的思想”。AI和人類的互信模式會和以往的互信模式不同。
工業(yè)革命中,機器的意義是幫助人擺脫了重復和繁重的“體力”勞動;AI智能的終極意義是幫助人擺脫重復的“腦力”勞動,幫助人更好地創(chuàng)新。在此目標下建立的可以信任的AI智能機器,可以跳出任何舊法律的束縛,而不應該受到懲罰。
(作者系技術發(fā)燒友和投資人)
第一財經(jīng)獲授權轉載自微信公眾號“秦朔朋友圈”。
國產(chǎn)AI大模型“AI孫悟空”亮相大阪世博會;字節(jié)跳動正計劃推出自家的AI智能眼鏡;貝瑞基因GENOisi?智能體正式發(fā)布。
百度推出外貿企業(yè)AI扶持計劃;全球首個消化內鏡全場景智能體“鏡觀”在滬亮相;OpenAI宣布ChatGPT自4月30日起升級至4o版本。
人工智能的迅猛發(fā)展引發(fā)了對人類價值和尊嚴的深刻思考,如何界定人與機器的本質區(qū)別成為關鍵問題。
市場監(jiān)管總局:正在加快推進人工智能國家標準研制工作;中國聯(lián)通與阿里巴巴簽署戰(zhàn)略合作協(xié)議,雙方將在AI智能終端、產(chǎn)業(yè)智能化升級等方面展開深入合作。
AI科技創(chuàng)新與產(chǎn)業(yè)創(chuàng)新的深度融合,正在重塑中國經(jīng)濟的底層邏輯。通過政策引導、技術突破與產(chǎn)業(yè)實踐的協(xié)同發(fā)力,我國不僅加速培育新質生產(chǎn)力,更在全球價值鏈重構中占據(jù)主動。未來,需持續(xù)優(yōu)化創(chuàng)新生態(tài),強化基礎研究投入,完善成果轉化機制,方能在智能經(jīng)濟時代實現(xiàn)高質量發(fā)展。