分享到微信打開微信,點擊底部的“發(fā)現(xiàn)”, |
近日,有消息稱字節(jié)跳動發(fā)生大模型訓練被實習生“投毒”事件。
據(jù)悉,該事件發(fā)生在字節(jié)跳動商業(yè)化團隊,因?qū)嵙暽锬衬硨F隊資源分配不滿,利用HF(huggingface)的漏洞,通過共享模型注入破壞代碼,導致團隊模型訓練成果受損。消息稱此次遭到入侵的代碼已注入8000多張卡,損失或達千萬美元。
字節(jié)跳動知情人士向記者透露稱,近期公司確實發(fā)生過破壞模型訓練一事,但傳聞存在夸張和虛構的部分,該事件實際發(fā)生在今年6月底,田某某是在商業(yè)化技術團隊實習,因為對團隊資源分配不滿,使用攻擊代碼破壞團隊的模型訓練任務,千萬美元損失的數(shù)字也有所夸大。
另外,該人士稱,受代碼入侵影響的業(yè)務不是豆包大模型,而是商業(yè)化技術團隊的模型訓練任務,影響了廣告部門的部分研究工作,實習生通過共享模型進行入侵的部分也不屬于集團大模型。
此次事件暴露出字節(jié)跳動技術訓練中存在的安全管理問題,包括權限隔離、共用代碼的審計等。一位行業(yè)人士對記者表示,進行權限隔離與審計利于保護公司核心數(shù)據(jù)與知識產(chǎn)權,防止數(shù)據(jù)泄漏,提高數(shù)據(jù)與系統(tǒng)的安全性。比如實時監(jiān)控權限使用情況,及時發(fā)現(xiàn)權限濫用和異常操作;定期審計權限,檢查團隊成員的權限是否符合授權策略,是否存在權限濫用的情況等。但這件事也有難度,包括跨部門合作成本、經(jīng)常性維護與更新的資源投入等。
據(jù)知情人士向記者透露,目前該實習生已被辭退,公司也將相關情況同步給行業(yè)聯(lián)盟與實習生學校。
最新的字節(jié)跳動大模型信息披露發(fā)生在今年10月15日,火山引擎在視頻云技術大會上發(fā)布了大模型訓練視頻預處理方案,助力解決視頻大模型訓練的成本、質(zhì)量和性能等方面的技術挑戰(zhàn)。目前,該技術方案已應用于豆包視頻生成模型。
騰訊推出“青云計劃”招聘專項,將大模型作為投入力度最大的關鍵領域。
百億量化私募鳴石基金考慮“直接參與AI產(chǎn)業(yè)發(fā)展”;國金證券自研大模型獲得兩項國家發(fā)明專利授權。
原字節(jié)跳動旗下火山引擎AI應用產(chǎn)品負責人駱怡航正式加入生數(shù)科技,擔任CEO職務。
第一財經(jīng)每日精選最熱門大公司動態(tài),點擊「聽新聞」,一鍵收聽。
2月11日,有消息稱,阿里巴巴創(chuàng)始人馬云現(xiàn)身阿里巴巴園區(qū)。