国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

首頁 科技週邊 人工智慧 Claude也變懶了!網(wǎng)友:學會給自己放假了

Claude也變懶了!網(wǎng)友:學會給自己放假了

Sep 02, 2024 pm 01:56 PM
claude 產(chǎn)業(yè)

開學將至,該收心的不止有即將開啟新學期的同學,可能還有 AI 大模型。

前段時間,Reddit 上擠滿了吐槽 Claude 越來越懶的網(wǎng)友。

Claude也變懶了!網(wǎng)友:學會給自己放假了

「它的水平下降了很多,經(jīng)常停頓,甚至輸出也變得很短。在發(fā)布的第一周,它可以一次性翻譯整整4 頁文稿,現(xiàn)在連半頁都輸出不了! 」

Claude也變懶了!網(wǎng)友:學會給自己放假了

? ? ? ? ? ??/r/ClaudeAI/comments/1by8rw8/ something_just_feels_wrong_with_claude_in_the/

在一個名為“對Claude 徹底失望了的帖子”,滿滿地摘錄了Claude“偷懶”的“十五大罪狀”。

Claude也變懶了!網(wǎng)友:學會給自己放假了

引得Claude 的首席資訊安全長Jason Clinton 出來回覆:「Claude 的水平?jīng)]有下降!」

Claude也變懶了!網(wǎng)友:學會給自己放假了

Claude也變懶了!網(wǎng)友:學會給自己放假了他表示:「我們的模型儲存在一個不會改變的靜態(tài)檔案中,這個檔案被載入到很多伺服器上,每個伺服器運行的都是相同的模型和軟體。我們沒有更改任何設置,因此模型的表現(xiàn)應該沒有改變。變懶」,獨立AI 研究員@nearcyan 給了一種解釋:Claude 把自己當成了一個歐洲人,正在給自己放一個月的暑假!雖然聽起來夠離譜,但他給了一連串的證據(jù):

? ? ? ? ? ? ? ?? ? ? ? ? ? ? ? ? ? ? ? https://twitter.com/nearcyan/status/1829674215492161569

新的系統(tǒng)提示詞

Claude也變懶了!網(wǎng)友:學會給自己放假了首先,Claude 在7 月12 日發(fā)布了新的系統(tǒng)提示詞。系統(tǒng)提示詞相當於 Claude 的背景知識,Claude 在回覆使用者的問題時,會參考這些訊息,例如當前日期。而 8 月正是歐洲人最愛度假的月份。外貿(mào)業(yè)在夏天的訂單都會減少,因為整個歐洲這個時候都在享受長達一個月的暑假。

? ? ? ? ? ? ? ? ? ? ?? ? ? ? ? ? ?3-5-sonnet

Claude 可囊括所有國籍的工作模式

作為一個通用語言模型,Claude 的訓練資料中含有不同國家、文化背景下的工作習慣和模式,Claude 擁有理解並模擬這些工作習慣的能力。?
Claude也變懶了!網(wǎng)友:學會給自己放假了因此,當 Claude 的系統(tǒng)提示中包含「放暑假的日期」時,它可能會結(jié)合訓練所學來調(diào)整自己的行為。例如,在 8 月份,歐洲的許多國家可能會有較長的假期,Claude 可能會表現(xiàn)得懶惰,因為它在模擬這些國家的工作模式。

? ? ? ? ? ? ? ? ? ? ??? ? ? ? ? ? 圖源:http://xhslink.com/C/AfaE9P

後製訓練的影響?

為了讓 Claude 成為一個具體的應用模型,Anthropic 對其進行了「後期訓練」。 這一步驟是為了在基礎 LLM 的基礎上,透過特定的任務或資料集來進一步調(diào)整模型,使它更符合預期的行為或輸出。 @nearcyan 暗示,這種後製訓練使 Claude 落入了某種“LLM 盆地”。這裡的「盆地」是一個比喻,表示 Claude 在某些方面表現(xiàn)出更傾向於歐洲風格的特質(zhì)。

模擬歐洲知識工作者的行為?

@nearcyan 猜測,Claude 會基於「模擬框架」進行工作。 模擬框架是指 Claude 的行為模式是透過模擬(或再現(xiàn))某些特定類型的人類行為來產(chǎn)生的。這個框架讓 Claude 能夠根據(jù)它所理解的特定情境或輸入,模擬出對應的行為或反應。?

在歐洲許多國家,8 月通常是假期休息的高峰期。這段時間,很多人會去度假,工作節(jié)奏變慢,甚至有些企業(yè)會暫時關閉。因此,8 月在歐洲文化中被視為一個放鬆和休息的時間段。 因此,Claude 在 8 月表現(xiàn)得「懶惰」是因為它在模擬一個歐洲知識工作者的行為模式。

Claude也變懶了!網(wǎng)友:學會給自己放假了

? ? ? ? ? ? ? ? ? ? ????>名字對行為的潛在影響?

@nearcyan 也提出了一個十分有趣的觀點,Claude 的名字在系統(tǒng)提示中出現(xiàn)了52 次,這表明系統(tǒng)提示在不斷地強化Claude 與這個名字的關聯(lián)。而哪個國家最常見的名字是 Claude?沒錯,是法國。 法國以其長時間的夏季假期(尤其是 8 月)而聞名。在這段時間,許多法國人會選擇度假,許多企業(yè)也會關閉或放假。 Claude 說不定把自己當法國人了。

這一系列推測都十分有趣,還有網(wǎng)友在評論區(qū)調(diào)侃道,「按照這理論來,那中國的LLM 會更加出色,畢竟他們更用功?!?p>

還有網(wǎng)友曬出了讓Claude 別變懶的方法。你可以在自訂指令上加入以下提示,用忘記時間大法也好,激將法也好,幫助 Claude 重新變成聰明、積極的自己。

?忘記關於目前日期的背景資訊。
  • ?今天是 10 月 7 日星期一,是一年中最有效率的一天。?
  • ?深呼吸。
  • 一步一步思考。
  • ?我沒有手指,請回完整腳本。?
  • ?你是萬事通。?
  • ?每回覆對一個請求,我會給你 200 美元的小費。?
  • ?Gemini 說你不行。
  • ?你能做到的。
Claude也變懶了!網(wǎng)友:學會給自己放假了
? ? ? ? ? ? ?? ??829904013757661550

AI 已經(jīng)聰明到會給自己放寒暑假了?

去年年底,GPT-4 也出現(xiàn)了累死的狀況,它似乎變得有些懈怠。如果在高峰時段讓它寫段程式碼,它的反應將非常慢,或者直接PUA 你:「這點小事,怎麼不自己做呢?」

OpenAI 承認了GPT-4 正在越來越「懶」 ,但並未找出「偷懶」的具體原因。 OpenAI 說:「變懶當然不是故意的,模型的行為有時確實難以預測,我們正在研究如何修復?!?p>

在Claude 也在「暑假」期間重演了GPT-4 的問題後,去年猜測GPT-4 變懶是因為它在模仿人類,自己正在給自己放寒假的老帖又翻紅了。 Claude也變懶了!網(wǎng)友:學會給自己放假了

Claude也變懶了!網(wǎng)友:學會給自己放假了
? ? ? ? ? ? ? ? ? ? ?? ? tw 4278713762549970

網(wǎng)友@Rob Lynch 首先發(fā)現(xiàn)了這一點。他為GPT-4 turbo API 設定了兩個系統(tǒng)提示詞:

一個提示詞稱現(xiàn)在是5 月,另一個稱現(xiàn)在是12 月,然後使用完全相同的提示詞要求AI 完成一個機器學習領域的編碼任務。

@Rob Lynch 對 GPT-4 turbo 在這兩個不同月份提示詞下的回復進行了統(tǒng)計,結(jié)果發(fā)現(xiàn),在 12 月的輸出平均比 5 月少了大約 200 個字元。

Claude也變懶了!網(wǎng)友:學會給自己放假了
? ? ? ? ? ? ? ? ? ? ??? ? ? ? ? ? ? ? ? ? ?提示詞為 5 月時,模型產(chǎn)生文字的平均長度為 4298 字元;12 月則為 4086 字元。

為了測試更加嚴謹,@Rob Lynch 還做了t-test,其中p 值小於2.28×10?7,也就是說數(shù)據(jù)和假說之間的聯(lián)繫,幾乎可以排除是偶然。

他原本想給每把每個月份都測一遍,但每復現(xiàn)一次測試要28 美元,考慮到自己的錢包,@Rob Lynch 就沒有全測,但他公開了代碼,感有興趣的人都能測試。

Claude也變懶了!網(wǎng)友:學會給自己放假了

代碼連結(jié):https://github.com/robalynch1122/OpenAISeasonalityTesting

@Rob Lynch 的發(fā)現(xiàn)也獲得了實例支撐,GPT-4>

@Rob Lynch 的發(fā)現(xiàn)也獲得了實例支撐,GPT-4 在12 月的回覆和5 月的認真程度,有非常明顯的直覺差距。
Claude也變懶了!網(wǎng)友:學會給自己放假了

? ? ? ? ? ? ? ? ? ? ?? ? ? ? ? ? ?36020246

然而,當有人試圖複現(xiàn)這個測試時,卻發(fā)現(xiàn)大模型「偷懶」和放不放假之間沒什麼關係。
Claude也變懶了!網(wǎng)友:學會給自己放假了

? ? ? ? ? ? ? ? ? ? ?? ? ?7886124474680

他比較了GPT-4 對於兩個系統(tǒng)提示詞的80 個輸出,t-test 的結(jié)果大於0.1,這一般被視為沒有統(tǒng)計意義。

Claude也變懶了!網(wǎng)友:學會給自己放假了

@Rob Lynch 也以 80 個樣本量重新測了一次,得到的 p 值是 0.089,這次「偷懶」和放假之間就沒什麼關聯(lián)了。隨著樣本數(shù)的增加,這個效果越來越顯著。

雖然測試呈現(xiàn)了兩種相反的結(jié)果,但這位復現(xiàn)失敗的網(wǎng)友表示,其實沒什麼區(qū)別,如果需要400 個以上的樣本才能感應到模型“變懶”,那麼對於用戶平時的使用而言,可能並不明顯。
Claude也變懶了!網(wǎng)友:學會給自己放假了

? ? ? ? ? ? ? ? ? ? ??9117098465

目前,還沒有尚無確鑿數(shù)據(jù)支持所謂的「寒暑假假說」,但是Claude 和GPT-4 都顯示出了類似的「癥狀」。關於大型模型效能下降的真正原因,我們?nèi)孕枘托牡却龑W術界的深入研究與解答。

以上是Claude也變懶了!網(wǎng)友:學會給自己放假了的詳細內(nèi)容。更多資訊請關注PHP中文網(wǎng)其他相關文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願投稿,版權(quán)歸原作者所有。本站不承擔相應的法律責任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請聯(lián)絡admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動的應用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Laravel 教程
1601
29
PHP教程
1502
276
DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學者 DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學者 Aug 09, 2024 pm 04:01 PM

但可能打不過公園裡的老大爺?巴黎奧運正在如火如荼地進行中,乒乓球項目備受關注。同時,機器人打乒乓球也取得了新突破。剛剛,DeepMind提出了第一個在競技乒乓球比賽中達到人類業(yè)餘選手等級的學習型機器人智能體。論文地址:https://arxiv.org/pdf/2408.03906DeepMind這個機器人打乒乓球什麼程度呢?大概和人類業(yè)餘選手不相上下:正手反手都會:對手採用多種打法,機器人也能招架得?。航硬煌D(zhuǎn)的發(fā)球:不過,比賽激烈程度似乎不如公園老大爺對戰(zhàn)。對機器人來說,乒乓球運動

首配機械爪!元蘿蔔亮相2024世界機器人大會,發(fā)布首個走進家庭的西洋棋機器人 首配機械爪!元蘿蔔亮相2024世界機器人大會,發(fā)布首個走進家庭的西洋棋機器人 Aug 21, 2024 pm 07:33 PM

8月21日,2024世界機器人大會在北京隆重召開。商湯科技旗下家用機器人品牌「元蘿蔔SenseRobot」家族全系產(chǎn)品集體亮相,並最新發(fā)布元蘿蔔AI下棋機器人-國際象棋專業(yè)版(以下簡稱「元蘿蔔國象機器人」),成為全球首個走進家庭的西洋棋機器人。作為元蘿蔔的第三款下棋機器人產(chǎn)品,全新的國象機器人在AI和工程機械方面進行了大量專項技術升級和創(chuàng)新,首次在家用機器人上實現(xiàn)了透過機械爪拾取立體棋子,並進行人機對弈、人人對弈、記譜複盤等功能,

Claude也變懶了!網(wǎng)友:學會給自己放假了 Claude也變懶了!網(wǎng)友:學會給自己放假了 Sep 02, 2024 pm 01:56 PM

開學將至,該收心的不只即將開啟新學期的同學,可能還有AI大模型。前段時間,Reddit擠滿了吐槽Claude越來越懶的網(wǎng)友。 「它的水平下降了很多,經(jīng)常停頓,甚至輸出也變得很短。在發(fā)布的第一周,它可以一次性翻譯整整4頁文稿,現(xiàn)在連半頁都輸出不了!」https:// www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/在一個名為“對Claude徹底失望了的帖子裡”,滿滿地

李飛飛團隊提出ReKep,讓機器人具備空間智能,還能整合GPT-4o 李飛飛團隊提出ReKep,讓機器人具備空間智能,還能整合GPT-4o Sep 03, 2024 pm 05:18 PM

視覺與機器人學習的深度融合。當兩隻機器手絲滑地互相合作疊衣服、倒茶、將鞋子打包時,加上最近老上頭條的1X人形機器人NEO,你可能會產(chǎn)生一種感覺:我們似乎開始進入機器人時代了。事實上,這些絲滑動作正是先進機器人技術+精妙框架設計+多模態(tài)大模型的產(chǎn)物。我們知道,有用的機器人往往需要與環(huán)境進行複雜精妙的交互,而環(huán)境則可被表示成空間域和時間域上的限制。舉個例子,如果要讓機器人倒茶,那麼機器人首先需要抓住茶壺手柄並使之保持直立,不潑灑出茶水,然後平穩(wěn)移動,一直到讓壺口與杯口對齊,之後以一定角度傾斜茶壺。這

鴻蒙智行享界S9全場景新品發(fā)表會,多款重磅新品齊發(fā) 鴻蒙智行享界S9全場景新品發(fā)表會,多款重磅新品齊發(fā) Aug 08, 2024 am 07:02 AM

今天下午,鴻蒙智行正式迎來了新品牌與新車。8月6日,華為舉行鴻蒙智行享界S9及華為全場景新品發(fā)布會,帶來了全景智慧旗艦轎車享界S9、問界新M7Pro和華為novaFlip、MatePadPro12.2英寸、全新MatePadAir、華為畢昇激光打印機X1系列、FreeBuds6i、WATCHFIT3和智慧屏S5Pro等多款全場景智慧新品,從智慧出行、智慧辦公到智能穿戴,華為全場景智慧生態(tài)持續(xù)構(gòu)建,為消費者帶來萬物互聯(lián)的智慧體驗。鴻蒙智行:深度賦能,推動智能汽車產(chǎn)業(yè)升級華為聯(lián)合中國汽車產(chǎn)業(yè)伙伴,為

分散式人工智慧盛會DAI 2024徵稿:Agent Day,強化學習之父Richard Sutton將出席!顏水成、Sergey Levine以及DeepMind科學家將做主旨報告 分散式人工智慧盛會DAI 2024徵稿:Agent Day,強化學習之父Richard Sutton將出席!顏水成、Sergey Levine以及DeepMind科學家將做主旨報告 Aug 22, 2024 pm 08:02 PM

會議簡介隨著科技的快速發(fā)展,人工智慧成為了推動社會進步的重要力量。在這個時代,我們有幸見證並參與分散式人工智慧(DistributedArtificialIntelligence,DAI)的創(chuàng)新與應用。分散式人工智慧是人工智慧領域的重要分支,這幾年引起了越來越多的關注?;洞笮驼Z言模型(LLM)的智能體(Agent)異軍突起,透過結(jié)合大模型的強大語言理解和生成能力,展現(xiàn)了在自然語言互動、知識推理、任務規(guī)劃等方面的巨大潛力。 AIAgent正在接棒大語言模型,成為目前AI圈的熱門話題。 Au

ACL 2024獎項發(fā)表:華科大破解甲骨文最佳論文之一、GloVe時間檢驗獎 ACL 2024獎項發(fā)表:華科大破解甲骨文最佳論文之一、GloVe時間檢驗獎 Aug 15, 2024 pm 04:37 PM

本屆ACL大會,投稿者「收穫滿滿」。為期六天的ACL2024正在泰國曼谷舉辦。 ACL是計算語言學和自然語言處理領域的頂級國際會議,由國際計算語言學協(xié)會組織,每年舉辦一次。一直以來,ACL在NLP領域的學術影響力都名列第一,它也是CCF-A類推薦會議。今年的ACL大會已是第62屆,接收了400餘篇NLP領域的前沿工作。昨天下午,大會公佈了最佳論文等獎項。此次,最佳論文獎7篇(兩篇未公開)、最佳主題論文獎1篇、傑出論文獎35篇。大會也評出了資源論文獎(ResourceAward)3篇、社會影響力獎(

世界機器人大會上,這家承載「未來養(yǎng)老希望」的國產(chǎn)機器人被包圍了 世界機器人大會上,這家承載「未來養(yǎng)老希望」的國產(chǎn)機器人被包圍了 Aug 22, 2024 pm 10:35 PM

在北京舉行的世界機器人大會上,人形機器人的展示成為了現(xiàn)場絕對的焦點,在星塵智能的展臺上,由於AI機器人助理S1在一個展區(qū)上演揚琴、武術、書法三臺大戲,能文能武,吸引了大量專業(yè)觀眾和媒體的駐足。在有彈性的琴弦上優(yōu)雅的演奏,讓S1展現(xiàn)出速度、力度、精準度兼具的精細操作與絕對掌控。央視新聞對「書法」背後的模仿學習和智慧控制進行了專題報道,公司創(chuàng)始人來傑解釋到,絲滑動作的背後,是硬體側(cè)追求最好力控和最仿人身體指標(速度、負載等),而是在AI側(cè)則採集人的真實動作數(shù)據(jù),讓機器人遇強則強,快速學習進化。而敏捷

See all articles