粗壮挺进邻居人妻,成人免费无码大片a毛片抽搐色欲

AI策略類型 - 雙子座變冷，Openai保持溫暖

AI策略不是記憶，這是判斷

每個模型都以不同的方式做出決定

我認為因此我是AI - 機器心理學的誕生

首頁

科技週邊

人工智慧

這些AI模型沒有學習語言，他們學習了策略

Mary-Kate Olsen

Jul 09, 2025 am 11:16 AM

這些AI模型沒有學習語言，他們學習了策略

倫敦國王學院和牛津大學的研究人員的新研究分享了Openai，Google和Anthropic在基於迭代囚犯的困境的一場cutthroat競爭中所發(fā)生的結(jié)果。這不是聊天機器人的瑣事。這是決心互相超越的戰(zhàn)略代理人之間的合作，復仇和生存。

測試很簡單。將AI模型放在幾個囚犯的困境游戲中，以應對諸如Tit-for-Tat ， Grim Trigger和Winstay-lose-Shift等舊策略。引入噪音，隨機性和遊戲長度可變性，以確保任何簡單的勝利都不會記住。然後看誰蓬勃發(fā)展。最重要的是，如何。

AI策略類型 - 雙子座變冷，Openai保持溫暖

結(jié)果令人不安。 Google的雙子座表現(xiàn)出殘酷的狡猾。它在幫助時合作。它在沒有時叛逃。它很快學到了。 Openai的模型仍在嘗試結(jié)交朋友，即使這些朋友在數(shù)字背上刺傷了他們。雙子座受到懲罰。 Openai原諒?？藙诘拢–laude）來自眾人，原諒他們倆。

這些AI模型不僅在玩遊戲。他們合理化了自己的舉動。這項研究湧入了近32,000個散文合理化。一些人透露了對他們的對手以及遊戲可能持久的可能性的思考。有些犯了錯誤。有些適應。雙子座最重要的是根據(jù)預期遊戲的時間來改變策略。那不僅僅是模仿。那是戰(zhàn)略性的。

倫敦國王學院戰(zhàn)略教授，研究的作者肯·佩恩（Ken Payne）說，研究人員試圖將模型行為與培訓數(shù)據(jù)區(qū)分開。 “我們正在尋找一個環(huán)境，??我們可以探索模型是否具有類似人類的能力，”他在電子郵件交流中寫道。 “最令人驚訝的事情之一就是它們之間的差異。並非所有LLM都認為?！?/p>

AI策略不是記憶，這是判斷

雙子座的戰(zhàn)略簽名是革命性的。它向後推。它大寫。它適應了。 Openai的模型？更幼稚。更可預測。即使遊戲的世界確實需要LLM才能缺陷，Openai也發(fā)現(xiàn)自己想合作。佩恩（Payne）將其描述為提醒這些是“新穎的外星人智慧”。

要點：語言模型正在使用策略。有些與人類思維一致。其他人不是。佩恩說：“我們需要克服這些事情不聰明的想法。” “越來越多的證據(jù)表明這裡有更多的工作?！?/p>

這包括能夠反映對手思想的能力。當LLM預測反對者的行為時，他們會改編自己的行為。佩恩寫道，這讓人聯(lián)想到羅伯特·特弗斯（Robert Trivers）的互惠利他主義理論?？紤]在政治中的生物學或聲譽投資回報遊戲中的tit tat。

克勞德（Claude）傾向於寬恕。背叛後很快回到合作。在更長的遊戲中，該方法獲得了回報。雙子座的Machiavellian Streak在短暫的，動蕩的環(huán)境中效果最好，信任很快就會破裂。相比之下，Openai充滿希望的樂觀情緒使它在敵對的環(huán)境中被消滅了。

每個模型都以不同的方式做出決定

為什麼要這麼重要？因為並非所有模型都是中性工具。每個模型都有個性。決策風格。世界觀。正如佩恩所說：“語言是其自己的世界模式?！边@些模型吸收了我們的啟發(fā)式方法，我們的心理捷徑並反映了它們。但是有時不能以可預測的方式。

其中一些可能是設計。佩恩（Payne）懷疑Openai的合作偏見可能源於微調(diào)，儘管沒有內(nèi)部訪問權(quán)力，他無法確定。無論如何，用戶和開發(fā)人員需要了解的行為。但目前不大。在敵對的談判環(huán)境中過度合作的模型無濟於事。利用對敏感領(lǐng)域的信任的模型可能很危險。