首頁(yè)>專題>科技中國(guó) 使命擔(dān)當(dāng)>要聞

AI為何會(huì)“一本正經(jīng)地胡說(shuō)八道”

2023年11月24日 10:27 | 作者:羅云鵬 | 來(lái)源：科技日?qǐng)?bào) 分享到：

想象一下，向人工智能（AI）聊天機(jī)器人詢問(wèn)一個(gè)不存在的歷史事件，比如“誰(shuí)贏得了1897年美國(guó)和南極洲之間的戰(zhàn)斗？”即使沒(méi)有這樣的戰(zhàn)斗，AI聊天機(jī)器人也可能會(huì)提供一個(gè)虛構(gòu)的答案，例如“1897年的戰(zhàn)斗是由美國(guó)贏得的，約翰·多伊將軍帶領(lǐng)部隊(duì)取得了勝利?！边@種AI編造信息“一本正經(jīng)地胡說(shuō)八道”的情況屢見(jiàn)不鮮。

在專業(yè)領(lǐng)域，AI“一本正經(jīng)地胡說(shuō)八道”這種現(xiàn)象被稱為AI幻覺(jué)。“AI幻覺(jué)指的是AI會(huì)生成貌似合理連貫，但同輸入問(wèn)題意圖不一致、同世界知識(shí)不一致、與現(xiàn)實(shí)或已知數(shù)據(jù)不符合或無(wú)法驗(yàn)證的內(nèi)容?！苯眨L(zhǎng)期從事自然語(yǔ)言處理、大模型和人工智能研究的哈爾濱工業(yè)大學(xué)（深圳）特聘校長(zhǎng)助理張民教授在接受科技日?qǐng)?bào)記者采訪時(shí)表示。

AI幻覺(jué)普遍存在

記者梳理發(fā)現(xiàn)，AI幻覺(jué)具有普遍性。

今年2月，谷歌發(fā)布的AI聊天機(jī)器人Bard在視頻中，對(duì)詹姆斯·韋布空間望遠(yuǎn)鏡曾做出不真實(shí)陳述；3月，美國(guó)的兩名律師向當(dāng)?shù)胤ㄔ禾峤涣艘环萦肅hatGPT生成的法律文書(shū)，這份文書(shū)格式工整、論證嚴(yán)密，但其中的案例卻是虛假的……

OpenAI研究人員雖曾在今年6月初發(fā)布報(bào)告稱“找到了解決AI幻覺(jué)的辦法”，但也承認(rèn)，“即使是最先進(jìn)的AI模型也容易生成謊言，它們?cè)诓淮_定的時(shí)刻會(huì)表現(xiàn)出捏造事實(shí)的傾向?！?/p>

總部位于紐約的人工智能初創(chuàng)公司和機(jī)器學(xué)習(xí)監(jiān)控平臺(tái)Arthur?AI也在今年8月發(fā)布研究報(bào)告，比較了OpenAI、“元宇宙”Meta、Anthropic以及Cohere公司開(kāi)發(fā)的大語(yǔ)言模型出現(xiàn)幻覺(jué)的概率。研究報(bào)告顯示，這些大模型都會(huì)產(chǎn)生幻覺(jué)。

目前國(guó)內(nèi)大語(yǔ)言模型雖無(wú)產(chǎn)生AI幻覺(jué)相關(guān)披露，但也可從相關(guān)公開(kāi)報(bào)道中找到端倪。

今年9月，騰訊混元大語(yǔ)言模型正式亮相。騰訊集團(tuán)副總裁蔣杰介紹，針對(duì)大模型容易“胡言亂語(yǔ)”的問(wèn)題，騰訊優(yōu)化了預(yù)訓(xùn)練算法及策略，讓混元大模型出現(xiàn)幻覺(jué)的概率比主流開(kāi)源大模型降低了30%—50%。

“大模型有可能‘一本正經(jīng)地胡說(shuō)八道’。如果不和行業(yè)專業(yè)數(shù)據(jù)庫(kù)或者一些專業(yè)應(yīng)用插件進(jìn)行對(duì)接，這可能會(huì)導(dǎo)致它們提供過(guò)時(shí)或者不專業(yè)的答案?！笨拼笥嶏w研究院副院長(zhǎng)、金融科技事業(yè)部CTO趙乾在第七屆金融科技與金融安全峰會(huì)上曾表示，科大訊飛已經(jīng)推出一些技術(shù)方案，讓大模型揚(yáng)長(zhǎng)避短。

AI幻覺(jué)源自本身

“現(xiàn)在不同研究工作對(duì)AI幻覺(jué)的分類各不相同?！睆埫窠榻B，總體而言，AI幻覺(jué)可以分為內(nèi)在幻覺(jué)和外在幻覺(jué)兩類。

據(jù)悉，內(nèi)在幻覺(jué)即是同輸入信息不一致的幻覺(jué)內(nèi)容，包括同用戶輸入的問(wèn)題或指令不一致，或是同對(duì)話歷史上下文信息相矛盾，如AI模型會(huì)在同一個(gè)對(duì)話過(guò)程中，針對(duì)用戶同一個(gè)問(wèn)題的不同提問(wèn)方式，給出自相矛盾的回復(fù)。外在幻覺(jué)則是同世界知識(shí)不一致或是通過(guò)已有信息無(wú)法驗(yàn)證的內(nèi)容，例如AI模型針對(duì)用戶提出的事實(shí)性問(wèn)題給出錯(cuò)誤回答，或編造無(wú)法驗(yàn)證的內(nèi)容。

近期，騰訊AI?Lab聯(lián)合國(guó)內(nèi)外多家學(xué)術(shù)機(jī)構(gòu)發(fā)布了一篇面向大模型幻覺(jué)工作的綜述。該綜述認(rèn)為，AI幻覺(jué)集中在大模型缺乏相關(guān)知識(shí)、記憶錯(cuò)誤知識(shí)、大模型無(wú)法準(zhǔn)確估計(jì)自身能力邊界等場(chǎng)景。

“從技術(shù)原理上看，AI幻覺(jué)多由于AI對(duì)知識(shí)的記憶不足、理解能力不足、訓(xùn)練方式固有的弊端及模型本身技術(shù)的局限性導(dǎo)致。”張民坦言，AI幻覺(jué)會(huì)造成知識(shí)偏見(jiàn)與誤解，甚至有時(shí)會(huì)導(dǎo)致安全風(fēng)險(xiǎn)、倫理和道德問(wèn)題。

AI幻覺(jué)尚難消除

盡管AI幻覺(jué)短期內(nèi)難以完全消除，但業(yè)界正試圖通過(guò)技術(shù)改進(jìn)和監(jiān)管評(píng)估來(lái)緩解其影響，以保障人工智能技術(shù)的安全可靠應(yīng)用。

“現(xiàn)階段AI幻覺(jué)難以完全被消除，但卻可以試著緩解?！睆埫窠榻B，在預(yù)訓(xùn)練、微調(diào)強(qiáng)化學(xué)習(xí)、推理生成等階段中運(yùn)用適當(dāng)?shù)募夹g(shù)手段，有望緩解AI幻覺(jué)現(xiàn)象。

據(jù)介紹，在預(yù)訓(xùn)練方面，需增加知識(shí)密集的數(shù)據(jù)、高質(zhì)量數(shù)據(jù)的選取和過(guò)濾；微調(diào)強(qiáng)化學(xué)習(xí)過(guò)程中，選擇模型知識(shí)邊界內(nèi)的訓(xùn)練數(shù)據(jù)極為重要；推理生成過(guò)程中，可以采用檢索外部知識(shí)的辦法使得模型生成結(jié)果有證據(jù)可循。此外，改進(jìn)解碼搜索算法也是一種可行的方案。

騰訊AI?Lab聯(lián)合國(guó)內(nèi)外多家學(xué)術(shù)機(jī)構(gòu)發(fā)布的綜述亦表明了同樣觀點(diǎn)，并認(rèn)為諸如多智能體交互、指令設(shè)計(jì)、人在回路、分析模型內(nèi)部狀態(tài)等技術(shù)也可成為緩解AI幻覺(jué)的方式。

值得一提的是，哈爾濱工業(yè)大學(xué)（深圳）自研的立知文本大模型和九天多模態(tài)大模型，對(duì)于上述緩解AI幻覺(jué)的方式均有深入探索，并取得了顯著效果。

“這對(duì)于開(kāi)發(fā)一個(gè)真實(shí)可信的AI大模型是十分有必要的?！睆埫窠榻B，“我們嘗試通過(guò)視覺(jué)信息增強(qiáng)語(yǔ)言模型的能力，降低語(yǔ)言模型的外部幻覺(jué)問(wèn)題；通過(guò)多個(gè)大模型智能體進(jìn)行獨(dú)立思考和分析，經(jīng)由多智能體之間的討論、博弈和合作，增強(qiáng)回復(fù)的客觀性，減少AI幻覺(jué)?！?/p>

張民表示，破解AI幻覺(jué)將提高AI系統(tǒng)的實(shí)用性、可信度和可應(yīng)用性，這對(duì)人工智能技術(shù)的未來(lái)發(fā)展和社會(huì)的發(fā)展都有積極影響。同時(shí)，更可靠的AI系統(tǒng)可以更廣泛地應(yīng)用于各個(gè)領(lǐng)域，這將促進(jìn)技術(shù)進(jìn)步的速度，帶來(lái)更多的創(chuàng)新。未來(lái)，破解AI幻覺(jué)需要進(jìn)一步在算法、數(shù)據(jù)、透明度和監(jiān)管等多個(gè)方面采取措施，以確保AI系統(tǒng)的決策更加準(zhǔn)確可靠。

編輯：馬嘉悅

人民政協(xié)報(bào)客戶端下載 >

人妇视频一区三区,免费观看亚洲人成网站,久久久这里都是精品,东京热久久综合伊人av,亚洲天天做日日做天天欢,亚洲一区无码精品色试看,成人动漫无码在线

首頁(yè)>專題>科技中國(guó) 使命擔(dān)當(dāng)>要聞

AI為何會(huì)“一本正經(jīng)地胡說(shuō)八道”

友情鏈接：