Christopher Nolan

Jul 08, 2025 am 01:44 AM

AIS夢想著電羊嗎？

推理模型的關(guān)鍵特徵是它通過將其分解為較小的部分並製定解決每個(gè)策略來解決複雜任務(wù)的能力。與僅依靠統(tǒng)計(jì)概率產(chǎn)生答案的模型不同，推理模型創(chuàng)建了與人類思維類似的問題解決策略。

為了註冊AI生成創(chuàng)意和潛在新穎的解決方案的Live Science Daily新聞通訊訂單，它必須參與某種水平的幻覺 - 否則，它將僅限於反省已經(jīng)學(xué)到的數(shù)據(jù)。

Vectra AI的AI研究員Sohrob Kazerounian在接受Live Science採訪時(shí)說：“了解幻覺不是幻覺，而是AI的特徵，而是AI的特徵?！?“正如同事曾經(jīng)說過的那樣，'LLM產(chǎn)生的一切都是幻覺。這只是其中一些幻覺恰好是真的。'如果AI僅生成了培訓(xùn)期間看到的確切副本，那麼AI將不過是大規(guī)模的搜索引擎?！?/p>

“這意味著只編寫以前寫過的代碼，只發(fā)現(xiàn)已經(jīng)知道的屬性的分子，並僅回答以前被問到的家庭作業(yè)問題。您將無法要求LLM為圍繞AI奇異性的概念專輯寫歌詞，結(jié)合了Snoop Dogg和Bob Dylan的風(fēng)格。”

有效地，LLMS和他們權(quán)力的AI系統(tǒng)需要幻覺才能產(chǎn)生原始內(nèi)容，而不是簡單地重複現(xiàn)有知識。從概念上講，這類似於人類夢想或想像場景引發(fā)新想法。

在框外思考太多

但是，當(dāng)目標(biāo)是傳遞精確和正確的信息時(shí)， AI幻覺就會成為問題，尤其是當(dāng)用戶接受無驗(yàn)證的輸出時(shí)。

沃森解釋說：“這在事實(shí)準(zhǔn)確性至關(guān)重要的領(lǐng)域尤其令人關(guān)注，例如醫(yī)學(xué)，法律或金融?！?“儘管更高級的模型可能會減少明顯的事實(shí)錯(cuò)誤，但幻覺的微妙形式仍然存在。隨著時(shí)間的流逝，這些捏造會破壞對AI系統(tǒng)的信任，並且當(dāng)用戶對未驗(yàn)證的信息採取行動時(shí)，可能會導(dǎo)致現(xiàn)實(shí)世界中的傷害?！?/p>

此外，隨著AI技術(shù)的進(jìn)展，這一挑戰(zhàn)似乎也會增長。沃森指出：“隨著模型的改善，錯(cuò)誤通常變得不那麼明顯，但很難檢測到?！?“現(xiàn)在被捏造的內(nèi)容嵌入了令人信服的敘述和邏輯推理鏈中。這造成了獨(dú)特的危險(xiǎn)：用戶可能沒有意識到存在錯(cuò)誤，並且可以將輸出視為確定性。該問題從濾除明顯的錯(cuò)誤到識別出僅在仔細(xì)檢查下浮出水面的細(xì)微扭曲而轉(zhuǎn)變?！?/p>

Kazerounian支持這種觀點(diǎn)。他說：“儘管對AI幻覺會隨著時(shí)間的流逝而逐漸減少，但有證據(jù)表明，較新的推理模型實(shí)際上可能比簡單的幻覺更頻繁地幻覺，而且對為什麼會發(fā)生這種情況尚無共識。”

由於難以理解LLM如何得出結(jié)論，這種情況與我們?nèi)匀徊煌耆斫馊四X的功能相似，這使情況更加複雜。

AI Company Anthropic的首席執(zhí)行官Dario Amodei在最近的一篇文章中指出，關(guān)於AIS如何產(chǎn)生響應(yīng)缺乏透明度。他寫道：“當(dāng)生成性AI總結(jié)了財(cái)務(wù)文件時(shí)，我們對為什麼要做出特定的單詞選擇或?yàn)槭颤N偶爾會出錯(cuò)，儘管通常是正確的?！?/p>

Kazerounian強(qiáng)調(diào)，AI產(chǎn)生虛假信息的後果已經(jīng)非常真實(shí)。他說：“沒有可靠的方法可以確保LLM正確回答有關(guān)它可以訪問的任何給定數(shù)據(jù)集的問題。” “不存在參考，客戶服務(wù)聊天機(jī)器人發(fā)明公司政策和其他不準(zhǔn)確的實(shí)例現(xiàn)在令人震驚?！?/p>

粉碎夢

Kazerounian和Watson都告訴Live Science，完全消除AI幻覺可能很困難。但是，可能有一些方法可以減少其影響。

沃森（Watson）提出，將模型的輸出與已驗(yàn)證的外部知識源聯(lián)繫起來的“檢索增強(qiáng)的一代”可以幫助實(shí)現(xiàn)事實(shí)數(shù)據(jù)中的AI生成的內(nèi)容。

沃森解釋說：“另一種策略涉及構(gòu)建模型的推理過程。通過提示驗(yàn)證自己的輸出，比較不同的觀點(diǎn)或遵循邏輯步驟，腳手架推理框架最大程度地減少了未檢查的猜測並提高一致性。”他補(bǔ)充說，這可以通過旨在鼓勵(lì)模型優(yōu)先級準(zhǔn)確性的培訓(xùn)方法來支持，並加強(qiáng)對人或AI評估者的學(xué)習(xí)，以促進(jìn)更多紀(jì)律和基於事實(shí)的響應(yīng)。

以上是為什麼AI會更頻繁地進(jìn)行Hallucin，我們?nèi)绾瓮Ｖ顾?？的詳?xì)內(nèi)容。更多資訊請關(guān)注PHP中文網(wǎng)其他相關(guān)文章！

本網(wǎng)站聲明

本文內(nèi)容由網(wǎng)友自願投稿，版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容，請聯(lián)絡(luò)admin@php.cn