国产92成人精品视频免费,成人av无码一区二区三区

AI策略類型 - 雙子座變冷，Openai保持溫暖

AI策略不是記憶，這是判斷

每個(gè)模型都以不同的方式做出決定

我認(rèn)為因此我是AI - 機(jī)器心理學(xué)的誕生

首頁

科技周邊

人工智能

這些AI模型沒有學(xué)習(xí)語言，他們學(xué)習(xí)了策略

Mary-Kate Olsen

Jul 09, 2025 am 11:16 AM

這些AI模型沒有學(xué)習(xí)語言，他們學(xué)習(xí)了策略

倫敦國王學(xué)院和牛津大學(xué)的研究人員的新研究分享了Openai，Google和Anthropic在基于迭代囚犯的困境的一場(chǎng)cutthroat競(jìng)爭(zhēng)中所發(fā)生的結(jié)果。這不是聊天機(jī)器人的瑣事。這是決心互相超越的戰(zhàn)略代理人之間的合作，復(fù)仇和生存。

測(cè)試很簡單。將AI模型放在幾個(gè)囚犯的困境游戲中，以應(yīng)對(duì)諸如Tit-for-Tat ， Grim Trigger和Winstay-lose-Shift等舊策略。引入噪音，隨機(jī)性和游戲長度可變性，以確保任何簡單的勝利都不會(huì)記住。然后看誰蓬勃發(fā)展。最重要的是，如何。

AI策略類型 - 雙子座變冷，Openai保持溫暖

結(jié)果令人不安。 Google的雙子座表現(xiàn)出殘酷的狡猾。它在幫助時(shí)合作。它在沒有時(shí)叛逃。它很快學(xué)到了。 Openai的模型仍在嘗試結(jié)交朋友，即使這些朋友在數(shù)字背上刺傷了他們。雙子座受到懲罰。 Openai原諒。克勞德（Claude）來自眾人，原諒他們倆。

這些AI模型不僅在玩游戲。他們合理化了自己的舉動(dòng)。這項(xiàng)研究涌入了近32,000個(gè)散文合理化。一些人透露了對(duì)他們的對(duì)手以及游戲可能持久的可能性的思考。有些犯了錯(cuò)誤。有些適應(yīng)。雙子座最重要的是根據(jù)預(yù)期游戲的時(shí)間來改變策略。那不僅僅是模仿。那是戰(zhàn)略性的。

倫敦國王學(xué)院戰(zhàn)略教授，研究的作者肯·佩恩（Ken Payne）說，研究人員試圖將模型行為與培訓(xùn)數(shù)據(jù)區(qū)分開?！拔覀冋趯ふ乙粋€(gè)環(huán)境，我們可以探索模型是否具有類似人類的能力，”他在電子郵件交流中寫道。 “最令人驚訝的事情之一就是它們之間的差異。并非所有LLM都認(rèn)為。”

AI策略不是記憶，這是判斷

雙子座的戰(zhàn)略簽名是革命性的。它向后推。它大寫。它適應(yīng)了。 Openai的模型？更幼稚。更可預(yù)測(cè)。即使游戲的世界確實(shí)需要LLM才能缺陷，Openai也發(fā)現(xiàn)自己想合作。佩恩（Payne）將其描述為提醒這些是“新穎的外星人智慧”。

要點(diǎn)：語言模型正在使用策略。有些與人類思維一致。其他人不是。佩恩說：“我們需要克服這些事情不聰明的想法?！?“越來越多的證據(jù)表明這里有更多的工作?！?/p>

這包括能夠反映對(duì)手思想的能力。當(dāng)LLM預(yù)測(cè)反對(duì)者的行為時(shí)，他們會(huì)改編自己的行為。佩恩寫道，這讓人聯(lián)想到羅伯特·特弗斯（Robert Trivers）的互惠利他主義理論?？紤]在政治中的生物學(xué)或聲譽(yù)投資回報(bào)游戲中的tit tat。

克勞德（Claude）傾向于寬恕。背叛后很快回到合作。在更長的游戲中，該方法獲得了回報(bào)。雙子座的Machiavellian Streak在短暫的，動(dòng)蕩的環(huán)境中效果最好，信任很快就會(huì)破裂。相比之下，Openai充滿希望的樂觀情緒使它在敵對(duì)的環(huán)境中被消滅了。

每個(gè)模型都以不同的方式做出決定

為什么要這么重要？因?yàn)椴⒎撬心Ｐ投际侵行怨ぞ摺Ｃ總€(gè)模型都有個(gè)性。決策風(fēng)格。世界觀。正如佩恩所說：“語言是其自己的世界模式?！边@些模型吸收了我們的啟發(fā)式方法，我們的心理捷徑并反映了它們。但是有時(shí)不能以可預(yù)測(cè)的方式。

其中一些可能是設(shè)計(jì)。佩恩（Payne）懷疑Openai的合作偏見可能源于微調(diào)，盡管沒有內(nèi)部訪問權(quán)力，他無法確定。無論如何，用戶和開發(fā)人員需要了解的行為。但目前不大。在敵對(duì)的談判環(huán)境中過度合作的模型無濟(jì)于事。利用對(duì)敏感領(lǐng)域的信任的模型可能很危險(xiǎn)。

我認(rèn)為因此我是AI - 機(jī)器心理學(xué)的誕生

這就是行為測(cè)試的來源。佩恩稱這種研究的早期階段為“機(jī)器心理學(xué)”。他認(rèn)為，在測(cè)試邊緣AI時(shí)，必須與業(yè)務(wù)相同。不僅是干凈，受控的實(shí)驗(yàn)室設(shè)置。他想看看模型在不干凈的條件下如何在部分?jǐn)?shù)據(jù)下進(jìn)行壓力。

未來的工作已經(jīng)在進(jìn)行中。佩恩暗示了升級(jí)動(dòng)力學(xué)和混合人機(jī)策略的實(shí)驗(yàn)。其中一位作者正在調(diào)查人類和模型一起做出決定時(shí)會(huì)發(fā)生什么。

佩恩認(rèn)為這不是新興的魔術(shù)。他認(rèn)為它是嵌入的。推理是用語言的，這些模型已經(jīng)消耗了很多。當(dāng)他們進(jìn)行戰(zhàn)略性行動(dòng)時(shí)，它們的行為就像我們一樣，依靠腳本，心理啟發(fā)式方法和武器規(guī)則融入文本中。

有時(shí)看起來很熟悉。有時(shí)看起來很陌生。這個(gè)中間空間是現(xiàn)在最大的問題。

Forbes5 Chatgpt Hacks，以幫助MBA的Tor Constantino到勞動(dòng)節(jié)到勞動(dòng)節(jié)減掉15磅

以上是這些AI模型沒有學(xué)習(xí)語言，他們學(xué)習(xí)了策略的詳細(xì)內(nèi)容。更多信息請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章！

本站聲明

本文內(nèi)容由網(wǎng)友自發(fā)貢獻(xiàn)，版權(quán)歸原作者所有，本站不承擔(dān)相應(yīng)法律責(zé)任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容，請(qǐng)聯(lián)系admin@php.cn