“模型崩潰”是今年7月發(fā)表在英國《">

久久久免费观成人影院,日韩亚洲欧美综合,中文字幕av一区,日本欧美一区二区三区

首頁  »  財經(jīng)  »  經(jīng)濟觀察

AI“模型崩潰”風險需警惕

2024-09-25 09:01:00

來源:科技日報

原標題:AI“模型崩潰”風險需警惕

從客戶服務到內(nèi)容創(chuàng)作,人工智能(AI)影響了眾多領域的進展。但是,一個日益嚴重的被稱為“模型崩潰”的問題,可能會使AI的所有成就功虧一簣。

“模型崩潰”是今年7月發(fā)表在英國《自然》雜志上的一篇研究論文指出的問題。它是指用AI生成的數(shù)據(jù)集訓練未來幾代機器學習模型,可能會嚴重“污染”它們的輸出。

多家外媒報道稱,這不僅是數(shù)據(jù)科學家需要擔心的技術問題,如果不加控制,“模型崩潰”可能會對企業(yè)、技術和整個數(shù)字生態(tài)系統(tǒng)產(chǎn)生深遠影響。天津大學自然語言處理實驗室負責人熊德意教授在接受科技日報記者采訪時,從專業(yè)角度對“模型崩潰”進行了解讀。

“模型崩潰”是怎么回事

大多數(shù)AI模型,比如GPT-4,都是通過大量數(shù)據(jù)進行訓練的,其中大部分數(shù)據(jù)來自互聯(lián)網(wǎng)。最初,這些數(shù)據(jù)是由人類生成的,反映了人類語言、行為和文化的多樣性和復雜性。AI從這些數(shù)據(jù)中學習,并用它來生成新內(nèi)容。

然而,當AI在網(wǎng)絡上搜索新數(shù)據(jù)來訓練下一代模型時,AI很可能會吸收一些自己生成的內(nèi)容,從而形成反饋循環(huán),其中一個AI的輸出成為另一個AI的輸入。當生成式AI用自己的內(nèi)容進行訓練時,其輸出也會偏離現(xiàn)實。這就像多次復制一份文件,每個版本都會丟失一些原始細節(jié),最終得到的是一個模糊的、不那么準確的結(jié)果。

美國《紐約時報》報道稱,當AI脫離人類輸入內(nèi)容時,其輸出的質(zhì)量和多樣性會下降。

熊德意解讀稱:“真實的人類語言數(shù)據(jù),其分布通常符合齊普夫定律,即詞頻與詞的排序成反比關系。齊普夫定律揭示了人類語言數(shù)據(jù)存在長尾現(xiàn)象,即存在大量的低頻且多樣化的內(nèi)容。”

熊德意進一步解釋道,由于存在近似采樣等錯誤,在模型生成的數(shù)據(jù)中,真實分布的長尾現(xiàn)象逐漸消失,模型生成數(shù)據(jù)的分布逐漸收斂至與真實分布不一致的分布,多樣性降低,導致“模型崩潰”。

AI自我“蠶食”是壞事嗎

對于“模型崩潰”,美國《The Week》雜志近日刊文評論稱,這意味著AI正在自我“蠶食”。

熊德意認為,伴隨著這一現(xiàn)象的出現(xiàn),模型生成數(shù)據(jù)在后續(xù)模型迭代訓練中占比越高,后續(xù)模型丟失真實數(shù)據(jù)的信息就會越多,模型訓練就更加困難。

乍一看,“模型崩潰”在當前似乎還是一個僅需要AI研究人員在實驗室中擔心的小眾問題,但其影響將是深遠而長久的。

美國《大西洋月刊》刊文指出,為了開發(fā)更先進的AI產(chǎn)品,科技巨頭可能不得不向程序提供合成數(shù)據(jù),即AI系統(tǒng)生成的模擬數(shù)據(jù)。然而,由于一些生成式AI的輸出充斥著偏見、虛假信息和荒謬內(nèi)容,這些會傳遞到AI模型的下一版本中。

美國《福布斯》雜志報道稱,“模型崩潰”還可能會加劇AI中的偏見和不平等問題。

不過,這并不意味著所有合成數(shù)據(jù)都是不好的。《紐約時報》表示,在某些情況下,合成數(shù)據(jù)可以幫助AI學習。例如,當使用大型AI模型的輸出訓練較小的模型時,或者當可以驗證正確答案時,比如數(shù)學問題的解決方案或國際象棋、圍棋等游戲的最佳策略。

AI正在占領互聯(lián)網(wǎng)嗎

訓練新AI模型的問題可能凸顯出一個更大的挑戰(zhàn)。《科學美國人》雜志表示,AI內(nèi)容正在占領互聯(lián)網(wǎng),大型語言模型生成的文本正充斥著數(shù)百個網(wǎng)站。與人工創(chuàng)作的內(nèi)容相比,AI內(nèi)容的創(chuàng)作速度更快,數(shù)量也更大。

OpenAI首席執(zhí)行官薩姆·奧特曼今年2月曾表示,該公司每天生成約1000億個單詞,相當于100萬本小說的文本,其中有一大部分會流入互聯(lián)網(wǎng)。

互聯(lián)網(wǎng)上大量的AI內(nèi)容,包括機器人發(fā)布的推文、荒謬的圖片和虛假評論,引發(fā)了一種更為消極的觀念。《福布斯》雜志稱,“死亡互聯(lián)網(wǎng)理論”認為,互聯(lián)網(wǎng)上的大部分流量、帖子和用戶都已被機器人和AI生成的內(nèi)容所取代,人類不再能決定互聯(lián)網(wǎng)的方向。這一觀念最初只在網(wǎng)絡論壇上流傳,但最近卻獲得了更多關注。

幸運的是,專家們表示,“死亡互聯(lián)網(wǎng)理論”尚未成為現(xiàn)實。《福布斯》雜志指出,絕大多數(shù)廣為流傳的帖子,包括一些深刻的觀點、犀利的語言、敏銳的觀察,以及在新背景下對新生事物的定義等內(nèi)容,都不是AI生成的。

不過,熊德意仍強調(diào):“隨著大模型的廣泛應用,AI合成數(shù)據(jù)在互聯(lián)網(wǎng)數(shù)據(jù)中的占比可能會越來越高,大量低質(zhì)量的AI合成數(shù)據(jù),不僅會使后續(xù)采用互聯(lián)網(wǎng)數(shù)據(jù)訓練的模型出現(xiàn)一定程度的‘模型崩潰’,而且也會對社會形成負面影響,比如生成的錯誤信息對部分人群形成誤導等。因此,AI生成內(nèi)容不僅是一個技術問題,同時也是社會問題,需要從安全治理與AI技術雙重角度進行有效應對。”

  • 相關閱讀
  • 今年前個八月全國工業(yè)設備投資增長11.1% 企業(yè)技術改造步伐加快

    本報記者 郭冀川隨著新一輪科技革命和產(chǎn)業(yè)變革的加速推進,制造業(yè)正面臨前所未有的轉(zhuǎn)型升級壓力,設備老化、技術落后已成為許多企業(yè)發(fā)展的瓶頸。今年3月份,國務院出臺《推動大規(guī)模設備更新和消費品以舊換新...

    時間:09-25
  • 安徽省政府發(fā)展研究中心黨組成員、副主任季翔:要敏銳把握電子商務這一時代浪潮

    本報訊 (記者徐一鳴)9月24日,中國(合肥)“創(chuàng)新·創(chuàng)業(yè)·創(chuàng)品牌”第11期沙龍在合肥市濱湖云谷創(chuàng)新園舉行,此次活動以“融入新賽道,驅(qū)動新增長”為主題,旨在響應國家創(chuàng)...

    時間:09-25
  • 生態(tài)環(huán)境部:著力推動減污降碳協(xié)同增效 發(fā)展的“含綠量”明顯增加

    本報訊 (記者寇佳麗)9月25日上午,國務院新聞辦公室舉行“推動高質(zhì)量發(fā)展”系列主題新聞發(fā)布會。會上,生態(tài)環(huán)境部部長黃潤秋表示,高質(zhì)量發(fā)展是全面建設社會主義現(xiàn)代化國家的首要任務,是新時代...

    時間:09-25
  • 人民幣匯率盤中回到“6”,為2023年5月份以來首次!

    本報記者 韓昱近期人民幣對美元匯率的“強勢”仍在延續(xù)。在美聯(lián)儲實質(zhì)性轉(zhuǎn)向降息、國內(nèi)推出一系列重要政策的影響下,離岸人民幣對美元匯率在9月25日向上突破“7.0”關鍵點位,重新回到...

    時間:09-25
  • 1500億元國債助力以舊換新顯成效!

    本報記者 郭冀川9月25日,國家發(fā)展改革委召開專題發(fā)布會,介紹消費品以舊換新行動進展成效和典型做法。國家發(fā)展改革委資源節(jié)約和環(huán)境保護司副司長文華說:“隨著消費品以舊換新工作持續(xù)推進,政策效果...

    時間:09-25
  • MLF利率下調(diào)了!

    本報記者 劉琪9月25日,中國人民銀行在其網(wǎng)站“中期借貸便利工作信息”專欄中發(fā)布公告稱,為維護銀行體系流動性合理充裕,當日央行開展3000億元中期借貸便利(MLF)操作,期限1年,最高投標利率2...

    時間:09-25
  • 推動經(jīng)濟向“新”而行 險資加大力度支持資本市場

    人民網(wǎng)北京9月25日電 (記者杜燕飛)“資本市場對金融穩(wěn)定和經(jīng)濟發(fā)展無疑都具有重要作用。金融監(jiān)管總局一直高度重視資本市場,積極引導銀行、保險和資管機構(gòu)維護資本市場穩(wěn)定。”金融監(jiān)管總局局長李云澤24日在國新辦...

    時間:09-25
  • “做好金融五篇大文章 支持鄉(xiāng)村全面振興”主題研討會召開

    人民網(wǎng)北京9月25日電 (記者羅知之)近日,“做好金融五篇大文章 支持鄉(xiāng)村全面振興”主題研討會暨中國銀行業(yè)協(xié)會農(nóng)村中小銀行工作委員會換屆會議在北京召開。 中國銀行業(yè)協(xié)會黨委書記、專職副會長邢煒指出,農(nóng)村中小...

    時間:09-25
  • 新疆開行首趟中老鐵路國際冷鏈貨運班列

    人民網(wǎng)北京9月25日電 (記者王連香)據(jù)中國鐵路烏魯木齊局集團有限公司消息,9月24日,一列冷鏈班列從新疆烏魯木齊國際陸港區(qū)中歐班列(烏魯木齊)集結(jié)中心出發(fā),運往泰國曼谷,這是新疆開行的首趟中老鐵路國際冷鏈貨...

    時間:09-25
  • 鐵路12306推出同車接續(xù)功能:中途不下車,同車換席位

    人民網(wǎng)北京9月25日電 (記者王連香)記者從中國國家鐵路集團有限公司獲悉,為了給旅客出行提供更多選擇,鐵路12306手機APP和網(wǎng)站推出了同車接續(xù)功能,在查詢車票后,點擊“中轉(zhuǎn)”標簽,系統(tǒng)在提供不同車次換乘方案的...

    時間:09-25
免責聲明:本網(wǎng)對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。 本網(wǎng)站轉(zhuǎn)載圖片、文字之類版權申明,本網(wǎng)站無法鑒別所上傳圖片或文字的知識版權,如果侵犯,請及時通知我們,本網(wǎng)站將在第一時間及時刪除。