分享到微信打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
第一財(cái)經(jīng) 2024-10-19 12:59:49 聽新聞
作者:呂倩 責(zé)編:李娜
近日,有消息稱字節(jié)跳動(dòng)發(fā)生大模型訓(xùn)練被實(shí)習(xí)生“投毒”事件。
據(jù)悉,該事件發(fā)生在字節(jié)跳動(dòng)商業(yè)化團(tuán)隊(duì),因?qū)嵙?xí)生田某某對(duì)團(tuán)隊(duì)資源分配不滿,利用HF(huggingface)的漏洞,通過共享模型注入破壞代碼,導(dǎo)致團(tuán)隊(duì)模型訓(xùn)練成果受損。消息稱此次遭到入侵的代碼已注入8000多張卡,損失或達(dá)千萬美元。
字節(jié)跳動(dòng)知情人士向記者透露稱,近期公司確實(shí)發(fā)生過破壞模型訓(xùn)練一事,但傳聞存在夸張和虛構(gòu)的部分,該事件實(shí)際發(fā)生在今年6月底,田某某是在商業(yè)化技術(shù)團(tuán)隊(duì)實(shí)習(xí),因?yàn)閷?duì)團(tuán)隊(duì)資源分配不滿,使用攻擊代碼破壞團(tuán)隊(duì)的模型訓(xùn)練任務(wù),千萬美元損失的數(shù)字也有所夸大。
另外,該人士稱,受代碼入侵影響的業(yè)務(wù)不是豆包大模型,而是商業(yè)化技術(shù)團(tuán)隊(duì)的模型訓(xùn)練任務(wù),影響了廣告部門的部分研究工作,實(shí)習(xí)生通過共享模型進(jìn)行入侵的部分也不屬于集團(tuán)大模型。
此次事件暴露出字節(jié)跳動(dòng)技術(shù)訓(xùn)練中存在的安全管理問題,包括權(quán)限隔離、共用代碼的審計(jì)等。一位行業(yè)人士對(duì)記者表示,進(jìn)行權(quán)限隔離與審計(jì)利于保護(hù)公司核心數(shù)據(jù)與知識(shí)產(chǎn)權(quán),防止數(shù)據(jù)泄漏,提高數(shù)據(jù)與系統(tǒng)的安全性。比如實(shí)時(shí)監(jiān)控權(quán)限使用情況,及時(shí)發(fā)現(xiàn)權(quán)限濫用和異常操作;定期審計(jì)權(quán)限,檢查團(tuán)隊(duì)成員的權(quán)限是否符合授權(quán)策略,是否存在權(quán)限濫用的情況等。但這件事也有難度,包括跨部門合作成本、經(jīng)常性維護(hù)與更新的資源投入等。
據(jù)知情人士向記者透露,目前該實(shí)習(xí)生已被辭退,公司也將相關(guān)情況同步給行業(yè)聯(lián)盟與實(shí)習(xí)生學(xué)校。
最新的字節(jié)跳動(dòng)大模型信息披露發(fā)生在今年10月15日,火山引擎在視頻云技術(shù)大會(huì)上發(fā)布了大模型訓(xùn)練視頻預(yù)處理方案,助力解決視頻大模型訓(xùn)練的成本、質(zhì)量和性能等方面的技術(shù)挑戰(zhàn)。目前,該技術(shù)方案已應(yīng)用于豆包視頻生成模型。
第一財(cái)經(jīng)每日精選最熱門大公司動(dòng)態(tài),點(diǎn)擊「聽新聞」,一鍵收聽。
不止TikTok,字節(jié)旗下海外應(yīng)用或?qū)⑼酵7?/p>
不論如何,為了盡快提振iPhone在國內(nèi)的銷量并探索Apple Intelligence的商業(yè)模式,蘋果需要盡快敲定國內(nèi)的AI合作伙伴。
2024年冬季火山引擎FORCE原動(dòng)力大會(huì)于上海舉行,豆包大模型家族全新升級(jí),涉及豆包視覺理解模型、豆包通用模型pro、HiAgent 1.5等。
機(jī)構(gòu)稱,指數(shù)仍保持中線上漲態(tài)勢(shì)不變,唯一需要關(guān)注的是成交量變化對(duì)當(dāng)前A股的交易風(fēng)格有較大影響。