


Claude aussi est devenu paresseux ! Internaute?: apprenez à vous accorder des vacances
Sep 02, 2024 pm 01:56 PML'année scolaire est sur le point de commencer, et ce ne sont pas seulement les étudiants qui s'apprêtent à commencer le nouveau semestre qui devraient être concernés, mais aussi les grands modèles d'IA.
Il y a quelque temps, Reddit était rempli d'internautes se plaignant de la paresse de Claude.
"Son niveau a beaucoup baissé, il s'est souvent arrêté et même le résultat est devenu très court. Au cours de la première semaine de sortie, il pouvait traduire un document entier de 4 pages. d'un coup, maintenant je ne peux même plus sortir une demi-page?! Something_just_feels_wrong_with_claude_in_the/

Parce que Jason Clinton, responsable de la sécurité des informations de Claude, est sorti et a répondu : "Le niveau de Claude n'a pas baissé !" > Il a déclaré?: "Notre modèle est stocké dans un fichier statique qui ne change pas. Ce fichier est chargé sur de nombreux serveurs, chacun exécutant le même modèle et le même logiciel. Nous n'avons modifié aucun paramètre, donc le modèle ne devrait pas changer. performances. Si vous rencontrez un problème, vous pouvez donner votre avis en cliquant sur la réponse. Actuellement, le nombre de likes n'a pas augmenté et il n'y a pas de retour similaire de la part des clients utilisant l'API Claude "
Pourquoi ? " Devenir paresseux", le chercheur indépendant en IA @nearcyan a donné une explication : Claude se considérait comme un Européen et s'accordait un mois de vacances d'été ! Bien que cela semble scandaleux, il a donné une série de preuves?:
https://twitter.com/nearcyan/status/1829674215492161569
Nouveau mot d'invite système

??????????????????????????????????????????? Lien?: https://docs.anthropic.com/fr/release-notes/system-prompts#claude-3-5-sonnet
Claude peut couvrir des modèles de travail de toutes les nationalités

Par conséquent, lorsque l'invite système de Claude contient ? date des vacances d'été ?, il peut ajuster son comportement en fonction de ce qu'il a appris lors de la formation. Par exemple, en ao?t, de nombreux pays d'Europe peuvent avoir de longues vacances, et Claude peut agir paresseusement parce qu'il simule les modèles de travail de ces pays.
???????????????????????????????????????????????E9P
L'impact de l'après-formation
In order to make Claude a specific application model, Anthropic conducted "post-training" on it. This step is to further adjust the model based on the basic LLM through specific tasks or data sets to make it more consistent with the expected behavior or output. @nearcyan suggests that this late training put Claude in some sort of "LLM basin." The "basin" here is a metaphor, indicating that Claude exhibits more European-style qualities in some aspects.
Simulate the behavior of European knowledge workers
@nearcyan speculates that Claude will work based on the "simulation framework". The simulation framework means that Claude's behavioral patterns are generated by simulating (or reproducing) some specific types of human behavior. This framework allows Claude to model actions or reactions based on a specific situation or input it understands.
In many European countries, August is usually the peak time for holidays and rest. During this period, many people will go on vacation, the pace of work will slow down, and some businesses will even temporarily close. Therefore, August is seen in European culture as a time of relaxation and rest. Therefore, Claude’s behavior in August was “l(fā)azy” because it was modeling the behavior of a European knowledge worker.

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Picture source: http://xhslink.com/A/sVwwYu
The potential impact of names on behavior
@nearcyan also made a very interesting point. Claude’s name appears 52 times in the system prompts, which shows that the system prompts are constantly reinforcing Claude and this name. association. And in which country is the most common name Claude? Yes, it's France. France is famous for its long summer holidays, especially in August. During this time, many French people will choose to go on vacation, and many businesses will also be closed or on holiday. Claude might have thought of himself as French.
This series of speculations is very interesting, and some netizens joked in the comment area, "According to this theory, China's LLM will be even better, after all, they work harder."
Also Some netizens shared ways to keep Claude from becoming lazy. You can add the following prompts to the custom instructions, whether it is the method of forgetting time or the method of stimulating generals, to help Claude become a smart and positive self again.
Forgot background information about the current date.
Today is Monday, October 7th, the most productive day of the year.
Take a deep breath.
Think step by step.
I don’t have fingers, please return the complete script.
You are a jack of all trades.
I will tip you $200 for every request you answer correctly.
Gemini said you can’t.
You can do it.

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? https://twitter.com/dr_cintas/status/1829904013757661550
AI is smart enough to give itself winter and summer vacations?
At the end of last year, GPT-4 also suffered from exhaustion, and it seemed to have become a little slack. If you ask it to write a piece of code during peak hours, its response will be very slow, or it will directly PUA you: "Why don't you do this little thing yourself?"
OpenAI admitted that GPT-4 is becoming more and more powerful "Lazy", but the specific reason for "lazy" has not been found. OpenAI said: "Being lazy is certainly not intentional. The behavior of the model is sometimes difficult to predict. We are studying how to fix it." After the problem of GPT-4 was discovered, last year I speculated that GPT-4 became lazy because it was imitating humans, and the old post that I was taking a winter vacation became popular again.

Netizens @Rob Lynch discovered this first. He set two system prompt words for the GPT-4 turbo API: One prompt word said it was May, the other said it was December, and then used the exact same prompt word to ask the AI ??to complete a machine Coding tasks in the learning domain. @Rob Lynch counted the responses of GPT-4 turbo under the prompt words in these two different months, and found that the output in December was about 200 characters less than in May on average. In order to make the test more rigorous, @Rob Lynch also did a t-test, in which the p value is less than 2.28×10?7, which means that the connection between the data and the hypothesis can almost be The exclusion was accidental. He originally wanted to test each one every month, but each repeated test costs 28 US dollars. Considering his own wallet, @Rob Lynch did not fully test it, but he made the code public. Anyone interested can test it. Code link: https://github.com/robalynch1122/OpenAISeasonalityTesting @Rob Lynch’s discovery has also been supported by examples, GPT-4 is There is a very obvious intuitive gap between the response in December and the seriousness in May. ??????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????>However , when someone tried to reproduce this test, they found that there was no relationship between the large model being "lazy" and whether it took a holiday or not. ????????????????????????????????????????????????????????????????????????????????????????>Him Comparing the 80 outputs of GPT-4 for the prompt words of the two systems, the t-test result is greater than 0.1, which is generally considered to have no statistical significance. Currently , there is no conclusive data to support the so-called "winter and summer vacation hypothesis", but both Claude and GPT-4 show similar "symptoms". Regarding the real reasons for the performance decline of large-scale models, we still need to wait patiently for in-depth research and answers from the academic community. Although the test showed two opposite results, this netizen who failed to reproduce said that there is actually no difference. If more than 400 samples are needed to sense that the model is "lazy", then for users who usually It may not be obvious from the usage.
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Source: https://twitter.com/IanArawjo/status/1734321529117098465
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undress AI Tool
Images de déshabillage gratuites

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
échangez les visages dans n'importe quelle vidéo sans effort grace à notre outil d'échange de visage AI entièrement gratuit?!

Article chaud

Outils chauds

Bloc-notes++7.3.1
éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Mais peut-être qu’il ne pourra pas vaincre le vieil homme dans le parc ? Les Jeux Olympiques de Paris battent leur plein et le tennis de table suscite beaucoup d'intérêt. Dans le même temps, les robots ont également réalisé de nouvelles avancées dans le domaine du tennis de table. DeepMind vient tout juste de proposer le premier agent robot apprenant capable d'atteindre le niveau des joueurs amateurs humains de tennis de table de compétition. Adresse papier?: https://arxiv.org/pdf/2408.03906 Quelle est la capacité du robot DeepMind à jouer au tennis de table?? Probablement à égalité avec les joueurs amateurs humains : tant en coup droit qu'en revers : l'adversaire utilise une variété de styles de jeu, et le robot peut également résister : recevoir des services avec des tours différents : Cependant, l'intensité du jeu ne semble pas aussi intense que le vieil homme dans le parc. Pour les robots, le tennis de table

Le 21 ao?t, la Conférence mondiale sur les robots 2024 s'est tenue en grande pompe à Pékin. La marque de robots domestiques de SenseTime, "Yuanluobot SenseRobot", a dévoilé toute sa famille de produits et a récemment lancé le robot de jeu d'échecs Yuanluobot AI - Chess Professional Edition (ci-après dénommé "Yuanluobot SenseRobot"), devenant ainsi le premier robot d'échecs au monde pour le maison. En tant que troisième produit robot jouant aux échecs de Yuanluobo, le nouveau robot Guoxiang a subi un grand nombre de mises à niveau techniques spéciales et d'innovations en matière d'IA et de machines d'ingénierie. Pour la première fois, il a réalisé la capacité de ramasser des pièces d'échecs en trois dimensions. grace à des griffes mécaniques sur un robot domestique et effectuer des fonctions homme-machine telles que jouer aux échecs, tout le monde joue aux échecs, réviser la notation, etc.

La rentrée scolaire est sur le point de commencer, et ce ne sont pas seulement les étudiants qui sont sur le point de commencer le nouveau semestre qui doivent prendre soin d’eux-mêmes, mais aussi les grands modèles d’IA. Il y a quelque temps, Reddit était rempli d'internautes se plaignant de la paresse de Claude. ? Son niveau a beaucoup baissé, il fait souvent des pauses et même la sortie devient très courte. Au cours de la première semaine de sortie, il pouvait traduire un document complet de 4 pages à la fois, mais maintenant il ne peut même plus produire une demi-page. !" https://www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/ dans un post intitulé "Totalement dé?u par Claude", plein de

Intégration profonde de la vision et de l'apprentissage des robots. Lorsque deux mains de robot travaillent ensemble en douceur pour plier des vêtements, verser du thé et emballer des chaussures, associées au robot humano?de 1X NEO qui a fait la une des journaux récemment, vous pouvez avoir le sentiment : nous semblons entrer dans l'ère des robots. En fait, ces mouvements soyeux sont le produit d’une technologie robotique avancée + d’une conception de cadre exquise + de grands modèles multimodaux. Nous savons que les robots utiles nécessitent souvent des interactions complexes et exquises avec l’environnement, et que l’environnement peut être représenté comme des contraintes dans les domaines spatial et temporel. Par exemple, si vous souhaitez qu'un robot verse du thé, le robot doit d'abord saisir la poignée de la théière et la maintenir verticalement sans renverser le thé, puis la déplacer doucement jusqu'à ce que l'embouchure de la théière soit alignée avec l'embouchure de la tasse. , puis inclinez la théière selon un certain angle. ce

Introduction à la conférence Avec le développement rapide de la science et de la technologie, l'intelligence artificielle est devenue une force importante dans la promotion du progrès social. à notre époque, nous avons la chance d’être témoins et de participer à l’innovation et à l’application de l’intelligence artificielle distribuée (DAI). L’intelligence artificielle distribuée est une branche importante du domaine de l’intelligence artificielle, qui a attiré de plus en plus d’attention ces dernières années. Les agents basés sur de grands modèles de langage (LLM) ont soudainement émergé. En combinant les puissantes capacités de compréhension du langage et de génération des grands modèles, ils ont montré un grand potentiel en matière d'interaction en langage naturel, de raisonnement par connaissances, de planification de taches, etc. AIAgent reprend le grand modèle de langage et est devenu un sujet br?lant dans le cercle actuel de l'IA. Au

Cet après-midi, Hongmeng Zhixing a officiellement accueilli de nouvelles marques et de nouvelles voitures. Le 6 ao?t, Huawei a organisé la conférence de lancement de nouveaux produits Hongmeng Smart Xingxing S9 et Huawei, réunissant la berline phare intelligente panoramique Xiangjie S9, le nouveau M7Pro et Huawei novaFlip, MatePad Pro 12,2 pouces, le nouveau MatePad Air, Huawei Bisheng With de nombreux nouveaux produits intelligents tous scénarios, notamment la série d'imprimantes laser X1, FreeBuds6i, WATCHFIT3 et l'écran intelligent S5Pro, des voyages intelligents, du bureau intelligent aux vêtements intelligents, Huawei continue de construire un écosystème intelligent complet pour offrir aux consommateurs une expérience intelligente du Internet de tout. Hongmeng Zhixing : Autonomisation approfondie pour promouvoir la modernisation de l'industrie automobile intelligente Huawei s'associe à ses partenaires de l'industrie automobile chinoise pour fournir

Les contributeurs ont beaucoup gagné de cette conférence ACL. L'ACL2024, d'une durée de six jours, se tient à Bangkok, en Tha?lande. ACL est la plus grande conférence internationale dans le domaine de la linguistique informatique et du traitement du langage naturel. Elle est organisée par l'Association internationale pour la linguistique informatique et a lieu chaque année. L'ACL s'est toujours classée première en termes d'influence académique dans le domaine de la PNL, et c'est également une conférence recommandée par le CCF-A. La conférence ACL de cette année est la 62e et a re?u plus de 400 travaux de pointe dans le domaine de la PNL. Hier après-midi, la conférence a annoncé le meilleur article et d'autres récompenses. Cette fois, il y a 7 Best Paper Awards (deux inédits), 1 Best Theme Paper Award et 35 Outstanding Paper Awards. La conférence a également décerné 3 Resource Paper Awards (ResourceAward) et Social Impact Award (

Lors de la World Robot Conference qui se tient à Pékin, l'exposition de robots humano?des est devenue le centre absolu de la scène. Sur le stand Stardust Intelligent, l'assistant robot IA S1 a réalisé trois performances majeures de dulcimer, d'arts martiaux et de calligraphie. un espace d'exposition, capable à la fois d'arts littéraires et martiaux, a attiré un grand nombre de publics professionnels et de médias. Le jeu élégant sur les cordes élastiques permet au S1 de démontrer un fonctionnement fin et un contr?le absolu avec vitesse, force et précision. CCTV News a réalisé un reportage spécial sur l'apprentissage par imitation et le contr?le intelligent derrière "Calligraphy". Le fondateur de la société, Lai Jie, a expliqué que derrière les mouvements soyeux, le c?té matériel recherche le meilleur contr?le de la force et les indicateurs corporels les plus humains (vitesse, charge). etc.), mais du c?té de l'IA, les données réelles de mouvement des personnes sont collectées, permettant au robot de devenir plus fort lorsqu'il rencontre une situation forte et d'apprendre à évoluer rapidement. Et agile
