分享到微信打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
機(jī)器學(xué)習(xí)(ML)暑期研習(xí)大會(huì)(OxML 2023)于7月7~16日在牛津大學(xué)數(shù)學(xué)研究所舉行。幾百名來自世界各地的AI專家和青年學(xué)者到會(huì),議題集中在AI的基礎(chǔ)構(gòu)建(ML、DL)及其在金融和醫(yī)療領(lǐng)域的應(yīng)用。
自去年11月ChatGPT發(fā)布以來,人工智能(AI)便成為了熱門話題。有人認(rèn)為AI敲響了碳基生命(包括人類)的喪鐘,也有人認(rèn)為AI鋪建了人類長壽幸福的大道。無論這些觀點(diǎn)孰是孰非,大家的共識(shí)是研討AI走向和運(yùn)用,培養(yǎng)理解和掌握AI的人才。牛津順勢推出這個(gè)為期九天的研習(xí)會(huì),主題包括ML的統(tǒng)計(jì)基礎(chǔ)、金融和醫(yī)療領(lǐng)域中的ML運(yùn)用、ML案例研究等。研習(xí)會(huì)演講團(tuán)隊(duì)由ML領(lǐng)域的知名專家、教授、研究人員和行業(yè)從業(yè)者組成,其中有四個(gè)討論最為精彩。
1.現(xiàn)在流行的AI模型有什么局限和前景?
數(shù)位學(xué)者指出了AI大型語言模形(LLM)的局限性。牛津大學(xué)的Steven Zohron認(rèn)為LLM可以生成高度連貫的文本,但它對(duì)語言沒有任何真正的理解,并會(huì)產(chǎn)生幻視,從而生成看似合理、實(shí)際錯(cuò)誤的答案。比如當(dāng)你問“你看見我的手機(jī)嗎”,它可能回答“我看見了”,但它不知道你實(shí)際問的是手機(jī)放哪了,正確答案應(yīng)該是“去查看是否掉到洗手間了”。
倫敦大學(xué)院的E. Cohere也舉例,當(dāng)被問及如何作弊不被抓時(shí),LLM拒答。但當(dāng)被問到采用什么具體步驟可以避免作弊被抓,LLM就會(huì)給出詳盡的建議。他們認(rèn)為LLM缺乏人類的直覺、倫理、經(jīng)驗(yàn)和協(xié)同。
一些與會(huì)學(xué)者則從哲學(xué)角度看到了AI的亮麗前景。DeepMind(深層心智)的Ali Eslami引用柏拉圖的洞穴理論,認(rèn)為人類看到的只是真實(shí)物體的影像,這對(duì)AI仿真人類分析鑒別有重要含義。首先,這表明AI有可能能夠以與人類相同的方式感知和理解世界,并有可能像人類一樣學(xué)習(xí)并做出復(fù)雜的決策。其次,這表明AI有可能能夠克服人類感知能力的局限性。例如,AI有可能能看到人類看不到的光譜,或者以人類無法理解的方式處理信息。
2.AI模型可以幫助選股和預(yù)測股市走向嗎?
雖然學(xué)者們同意所有的模型在一定意義上都是錯(cuò)的,但一致認(rèn)為AI模型預(yù)測股市比任何傳統(tǒng)模型都準(zhǔn)確。
牛津大學(xué)的Rama Cont推薦LSTM(長短期記憶神經(jīng)網(wǎng)絡(luò)),他說LSTM屬于深度學(xué)習(xí)模型,這是一種可以學(xué)習(xí)數(shù)據(jù)間長期依賴關(guān)系的周期性神經(jīng)網(wǎng)絡(luò),所以可以被用于時(shí)間序列的預(yù)測。由于股市預(yù)測涉及季節(jié)性、非線性和其他復(fù)雜模式的數(shù)據(jù)預(yù)測,因此LSTM模型優(yōu)于傳統(tǒng)的ARIMA模型。LSTM結(jié)合“門”(gates)、“狀態(tài)”(states)以及捕獲時(shí)間依賴性的能力,能夠有效地建模和掌握數(shù)據(jù)的動(dòng)態(tài)趨勢,從而實(shí)現(xiàn)更準(zhǔn)確、更可靠的預(yù)測。
Rama Cont認(rèn)為,AI模型可用來選股,包括單個(gè)股票的價(jià)格、收益及發(fā)展勢頭,幫助確定何時(shí)買進(jìn)和賣出股票。不過,用AI模型預(yù)測整個(gè)市場的變化比預(yù)測單個(gè)股票的走勢要準(zhǔn)確得多。
3.AI在醫(yī)療方面的應(yīng)用有何潛力?
與會(huì)學(xué)者普遍看好AI在醫(yī)學(xué)領(lǐng)域的應(yīng)用前景。劍橋大學(xué)的Puerto Lio分析了AI在臨床診斷、預(yù)判和干預(yù)措施方面的應(yīng)用,他認(rèn)為AI有望在癌癥的早期發(fā)現(xiàn)和診斷中發(fā)揮重要作用。例如,AI可以被訓(xùn)練識(shí)別CT或MRI掃描中的癌癥腫瘤,還可以用于分析血液樣本中癌癥相關(guān)的生物標(biāo)志,以幫助醫(yī)生識(shí)別癌癥風(fēng)險(xiǎn)較高的人。
劍橋大學(xué)的Mireia Crispin認(rèn)為,對(duì)有些藥物,研究人員完全不知道它們?yōu)槭裁磳?duì)某種疾病有效。比如抗生素是一種常見的抗感染藥物,但研究人員只知道抗生素可以通過殺死或抑制細(xì)菌而發(fā)揮作用,但不知道它們也可能通過其他方式起作用。再如抗抑郁藥是一種常見的精神疾病藥物,但研究人員并不完全了解它們?nèi)绾纹鹱饔玫?。AI及ML可以幫助研究人員解開這些謎團(tuán)。
佐治亞理工學(xué)院的M. Chaudhury相信“文明都是死于自殺,而非謀殺”(Civilizations die from suicide, not by murder),她因此專門分析了如何使用AI減少日益增長的自殺率。
4.量子計(jì)算機(jī)可以加速AI模型的訓(xùn)練嗎?
與會(huì)學(xué)者認(rèn)為,目前AI模型面臨的一大挑戰(zhàn)是,AI建模需要大量數(shù)據(jù),而就現(xiàn)在的計(jì)算機(jī)能力看,訓(xùn)練一個(gè)AI模型需要很長時(shí)間。
今年1月,谷歌憑借sycamore處理器宣示了其量子霸權(quán),4月IBM宣布了Eagle的127量子處理器。量子計(jì)算機(jī)的長足進(jìn)步引起與會(huì)者的關(guān)注。
有的學(xué)者認(rèn)為,量子計(jì)算機(jī)具備超強(qiáng)的計(jì)算能力,可在瞬間完成傳統(tǒng)計(jì)算機(jī)需要數(shù)年完成的計(jì)算量,這能幫助縮短AI的訓(xùn)練時(shí)間。但另一些學(xué)者指出,量子計(jì)算機(jī)比傳統(tǒng)計(jì)算機(jī)快是因?yàn)樗褂貌煌姆绞教幚硇畔?,傳統(tǒng)機(jī)使用位是0或1,而量子使用量子位可同時(shí)為0和1。由于這些特點(diǎn),Quantinuum研究機(jī)構(gòu)的Steph Clark指出,量子計(jì)算機(jī)更適合復(fù)雜的大運(yùn)算,比如用逆運(yùn)算破解區(qū)塊璉密碼的SHA256,或開發(fā)新的抗量子加密方法使之更安全,或挑選最優(yōu)方案的大運(yùn)算,但并不適合處理大數(shù)據(jù)。訓(xùn)練AI模型需要的是大數(shù)據(jù)處理,如分析天文數(shù)字的蛋白質(zhì)結(jié)構(gòu)。
盡管分歧存在,大家一致認(rèn)為量子技術(shù)還處于早期階段,潛力巨大。目前世界上沒有幾臺(tái)量子計(jì)算機(jī),對(duì)它的研究還是理論上的爭辯,并不是實(shí)驗(yàn)上的比較。
經(jīng)歷了近兩月的前期參與和九天的會(huì)議,筆者感受到了牛津AI研習(xí)的獨(dú)特之處。比較筆者在斯坦福和哈佛學(xué)習(xí)的經(jīng)歷,牛津新模式可以概括如下:
首先,與其他研習(xí)大會(huì)繳錢登記參會(huì)的模式不同,牛津參會(huì)者需要經(jīng)過嚴(yán)格的申請(qǐng)程序。這個(gè)過程在參會(huì)前近一年就開始了。申請(qǐng)者來自92個(gè)國家,錄取率不公開,通常低于10%。
其次,牛津研習(xí)會(huì)有點(diǎn)像行業(yè)年會(huì)和暑期學(xué)校的結(jié)合體。大會(huì)之前,有一個(gè)從5月1日開始的前期參與項(xiàng)目,主要在網(wǎng)上進(jìn)行,有講座、有作業(yè),還有項(xiàng)目競賽。
再次,牛研習(xí)會(huì)是一個(gè)非常有競爭性的項(xiàng)目。它的費(fèi)用低于哈佛、斯坦福和麻省理工的暑期項(xiàng)目。對(duì)有興趣了解ML或DL最新進(jìn)展的學(xué)者,這是一個(gè)絕佳機(jī)會(huì)。
最后是學(xué)術(shù)古城體驗(yàn)。參會(huì)前一天,主辦方安排了一個(gè)90分鐘的牛津城和大學(xué)校園游覽。那些查著牛津字典、讀著哈利波特小說長大的年輕人到這里不會(huì)感到陌生。大會(huì)的演講者和參會(huì)者中也不乏華人面孔,會(huì)場經(jīng)常能見到操著純正牛津口音的華人侃侃而談。
正如一句詩句所言,牛津是成長、創(chuàng)新和夢想的圣地,在那里,人們得到激勵(lì)、機(jī)會(huì)和支持。
(李運(yùn)奇系馬里蘭大學(xué)教授、Wesley Leeroy系哈佛大學(xué)SEAS學(xué)者)
抄底英偉達(dá)與否并非核心問題,關(guān)鍵在于技術(shù)的發(fā)展將加速“模型平價(jià)”(model parity),這將惠及更多消費(fèi)者。
報(bào)告認(rèn)為,盡管AI具有重塑經(jīng)濟(jì)和社會(huì)的潛力,但確保發(fā)展收益公平分配仍是全球重大挑戰(zhàn)。
AI制藥行業(yè)正展現(xiàn)出前所未有的廣闊發(fā)展前景,其重要性及影響力在醫(yī)藥領(lǐng)域內(nèi)日益凸顯。通過整合大數(shù)據(jù)與機(jī)器學(xué)習(xí)算法,AI制藥正全面推動(dòng)藥物研發(fā)流程的加速,為醫(yī)藥產(chǎn)業(yè)的革新與發(fā)展注入了新的活力。
黃仁勛認(rèn)為量子計(jì)算機(jī)推向市場或需要15年以上;國內(nèi)302款生成式人工智能服務(wù)已完成備案。
10年期美債觸及4.70%關(guān)口。