国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

Maison Périphériques technologiques IA Claude aussi est devenu paresseux ! Internaute?: apprenez à vous accorder des vacances

Claude aussi est devenu paresseux ! Internaute?: apprenez à vous accorder des vacances

Sep 02, 2024 pm 01:56 PM
claude industrie

L'année scolaire est sur le point de commencer, et ce ne sont pas seulement les étudiants qui s'apprêtent à commencer le nouveau semestre qui devraient être concernés, mais aussi les grands modèles d'IA.

Il y a quelque temps, Reddit était rempli d'internautes se plaignant de la paresse de Claude.

Claude aussi est devenu paresseux ! Internaute?: apprenez à vous accorder des vacances

"Son niveau a beaucoup baissé, il s'est souvent arrêté et même le résultat est devenu très court. Au cours de la première semaine de sortie, il pouvait traduire un document entier de 4 pages. d'un coup, maintenant je ne peux même plus sortir une demi-page?! Something_just_feels_wrong_with_claude_in_the/

Claude aussi est devenu paresseux ! Internaute?: apprenez à vous accorder des vacances
Dans un article intitulé "Complètement dé?u par Claude", il était extrait des "Quinze péchés" du "paresseux" de Claude. ".

Parce que Jason Clinton, responsable de la sécurité des informations de Claude, est sorti et a répondu : "Le niveau de Claude n'a pas baissé !" > Il a déclaré?: "Notre modèle est stocké dans un fichier statique qui ne change pas. Ce fichier est chargé sur de nombreux serveurs, chacun exécutant le même modèle et le même logiciel. Nous n'avons modifié aucun paramètre, donc le modèle ne devrait pas changer. performances. Si vous rencontrez un problème, vous pouvez donner votre avis en cliquant sur la réponse. Actuellement, le nombre de likes n'a pas augmenté et il n'y a pas de retour similaire de la part des clients utilisant l'API Claude "

Pourquoi ? " Devenir paresseux", le chercheur indépendant en IA @nearcyan a donné une explication : Claude se considérait comme un Européen et s'accordait un mois de vacances d'été ! Bien que cela semble scandaleux, il a donné une série de preuves?:

Claude aussi est devenu paresseux ! Internaute?: apprenez à vous accorder des vacances

https://twitter.com/nearcyan/status/1829674215492161569 Claude aussi est devenu paresseux ! Internaute?: apprenez à vous accorder des vacances

Nouveau mot d'invite système

Claude aussi est devenu paresseux ! Internaute?: apprenez à vous accorder des vacancesTout d'abord, Claude a publié un nouveau mot d'invite système le 12 juillet. Les mots d'invite du système sont équivalents aux connaissances de base de Claude. Claude fera référence à ces informations, comme la date actuelle, lorsqu'il répondra aux questions de l'utilisateur. Et ao?t est le mois de vacances préféré des Européens. Le secteur du commerce extérieur conna?tra moins de commandes cet été, car l'Europe entière profite actuellement de vacances d'été d'un mois.

??????????????????????????????????????????? Lien?: https://docs.anthropic.com/fr/release-notes/system-prompts#claude-3-5-sonnet

Claude peut couvrir des modèles de travail de toutes les nationalités

Claude aussi est devenu paresseux ! Internaute?: apprenez à vous accorder des vacancesEn tant que modèle de langage universel, les données de formation de Claude contiennent des informations provenant de différents pays et milieux culturels de travail habitudes et modèles, Claude a la capacité de comprendre et de modéliser ces habitudes de travail.

Par conséquent, lorsque l'invite système de Claude contient ? date des vacances d'été ?, il peut ajuster son comportement en fonction de ce qu'il a appris lors de la formation. Par exemple, en ao?t, de nombreux pays d'Europe peuvent avoir de longues vacances, et Claude peut agir paresseusement parce qu'il simule les modèles de travail de ces pays.

???????????????????????????????????????????????E9P

L'impact de l'après-formation

In order to make Claude a specific application model, Anthropic conducted "post-training" on it. This step is to further adjust the model based on the basic LLM through specific tasks or data sets to make it more consistent with the expected behavior or output. @nearcyan suggests that this late training put Claude in some sort of "LLM basin." The "basin" here is a metaphor, indicating that Claude exhibits more European-style qualities in some aspects.

Simulate the behavior of European knowledge workers

@nearcyan speculates that Claude will work based on the "simulation framework". The simulation framework means that Claude's behavioral patterns are generated by simulating (or reproducing) some specific types of human behavior. This framework allows Claude to model actions or reactions based on a specific situation or input it understands.

In many European countries, August is usually the peak time for holidays and rest. During this period, many people will go on vacation, the pace of work will slow down, and some businesses will even temporarily close. Therefore, August is seen in European culture as a time of relaxation and rest. Therefore, Claude’s behavior in August was “l(fā)azy” because it was modeling the behavior of a European knowledge worker.

Claude aussi est devenu paresseux ! Internaute?: apprenez à vous accorder des vacances

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Picture source: http://xhslink.com/A/sVwwYu

The potential impact of names on behavior

@nearcyan also made a very interesting point. Claude’s name appears 52 times in the system prompts, which shows that the system prompts are constantly reinforcing Claude and this name. association. And in which country is the most common name Claude? Yes, it's France. France is famous for its long summer holidays, especially in August. During this time, many French people will choose to go on vacation, and many businesses will also be closed or on holiday. Claude might have thought of himself as French.

This series of speculations is very interesting, and some netizens joked in the comment area, "According to this theory, China's LLM will be even better, after all, they work harder."

Also Some netizens shared ways to keep Claude from becoming lazy. You can add the following prompts to the custom instructions, whether it is the method of forgetting time or the method of stimulating generals, to help Claude become a smart and positive self again.

  • Forgot background information about the current date.

  • Today is Monday, October 7th, the most productive day of the year.

  • Take a deep breath.

  • Think step by step.

  • I don’t have fingers, please return the complete script.

  • You are a jack of all trades.

  • I will tip you $200 for every request you answer correctly.

  • Gemini said you can’t.

  • You can do it.

Claude aussi est devenu paresseux ! Internaute?: apprenez à vous accorder des vacances

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? https://twitter.com/dr_cintas/status/1829904013757661550

AI is smart enough to give itself winter and summer vacations?

At the end of last year, GPT-4 also suffered from exhaustion, and it seemed to have become a little slack. If you ask it to write a piece of code during peak hours, its response will be very slow, or it will directly PUA you: "Why don't you do this little thing yourself?"

OpenAI admitted that GPT-4 is becoming more and more powerful "Lazy", but the specific reason for "lazy" has not been found. OpenAI said: "Being lazy is certainly not intentional. The behavior of the model is sometimes difficult to predict. We are studying how to fix it." After the problem of GPT-4 was discovered, last year I speculated that GPT-4 became lazy because it was imitating humans, and the old post that I was taking a winter vacation became popular again.

Claude aussi est devenu paresseux ! Internaute?: apprenez à vous accorder des vacances

???>Claude aussi est devenu paresseux ! Internaute?: apprenez à vous accorder des vacances

Netizens @Rob Lynch discovered this first. He set two system prompt words for the GPT-4 turbo API: One prompt word said it was May, the other said it was December, and then used the exact same prompt word to ask the AI ??to complete a machine Coding tasks in the learning domain.

@Rob Lynch counted the responses of GPT-4 turbo under the prompt words in these two different months, and found that the output in December was about 200 characters less than in May on average.

Claude aussi est devenu paresseux ! Internaute?: apprenez à vous accorder des vacances
????????????????????????????????????????????????????The average length of text generated by the model was 4298 characters; in December it was 4086 characters.

In order to make the test more rigorous, @Rob Lynch also did a t-test, in which the p value is less than 2.28×10?7, which means that the connection between the data and the hypothesis can almost be The exclusion was accidental.

He originally wanted to test each one every month, but each repeated test costs 28 US dollars. Considering his own wallet, @Rob Lynch did not fully test it, but he made the code public. Anyone interested can test it.

Claude aussi est devenu paresseux ! Internaute?: apprenez à vous accorder des vacances

Code link: https://github.com/robalynch1122/OpenAISeasonalityTesting

@Rob Lynch’s discovery has also been supported by examples, GPT-4 is There is a very obvious intuitive gap between the response in December and the seriousness in May.

Claude aussi est devenu paresseux ! Internaute?: apprenez à vous accorder des vacances

??????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????>However , when someone tried to reproduce this test, they found that there was no relationship between the large model being "lazy" and whether it took a holiday or not.

Claude aussi est devenu paresseux ! Internaute?: apprenez à vous accorder des vacances

????????????????????????????????????????????????????????????????????????????????????????>Him Comparing the 80 outputs of GPT-4 for the prompt words of the two systems, the t-test result is greater than 0.1, which is generally considered to have no statistical significance.

@Rob Lynch also re-tested it with 80 samples, and the p-value obtained was 0.089. This time there is no correlation between "lazy" and vacation. As the sample size increases, this effect becomes more and more significant.

Claude aussi est devenu paresseux ! Internaute?: apprenez à vous accorder des vacancesAlthough the test showed two opposite results, this netizen who failed to reproduce said that there is actually no difference. If more than 400 samples are needed to sense that the model is "lazy", then for users who usually It may not be obvious from the usage.

Claude aussi est devenu paresseux ! Internaute?: apprenez à vous accorder des vacances ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Source: https://twitter.com/IanArawjo/status/1734321529117098465

Currently , there is no conclusive data to support the so-called "winter and summer vacation hypothesis", but both Claude and GPT-4 show similar "symptoms". Regarding the real reasons for the performance decline of large-scale models, we still need to wait patiently for in-depth research and answers from the academic community.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefa?on, veuillez contacter admin@php.cn

Outils d'IA chauds

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

échangez les visages dans n'importe quelle vidéo sans effort grace à notre outil d'échange de visage AI entièrement gratuit?!

Article chaud

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Tutoriel PHP
1502
276
Le robot DeepMind joue au tennis de table, et son coup droit et son revers glissent dans les airs, battant complètement les débutants humains Le robot DeepMind joue au tennis de table, et son coup droit et son revers glissent dans les airs, battant complètement les débutants humains Aug 09, 2024 pm 04:01 PM

Mais peut-être qu’il ne pourra pas vaincre le vieil homme dans le parc ? Les Jeux Olympiques de Paris battent leur plein et le tennis de table suscite beaucoup d'intérêt. Dans le même temps, les robots ont également réalisé de nouvelles avancées dans le domaine du tennis de table. DeepMind vient tout juste de proposer le premier agent robot apprenant capable d'atteindre le niveau des joueurs amateurs humains de tennis de table de compétition. Adresse papier?: https://arxiv.org/pdf/2408.03906 Quelle est la capacité du robot DeepMind à jouer au tennis de table?? Probablement à égalité avec les joueurs amateurs humains : tant en coup droit qu'en revers : l'adversaire utilise une variété de styles de jeu, et le robot peut également résister : recevoir des services avec des tours différents : Cependant, l'intensité du jeu ne semble pas aussi intense que le vieil homme dans le parc. Pour les robots, le tennis de table

La première griffe mécanique ! Yuanluobao est apparu à la World Robot Conference 2024 et a lancé le premier robot d'échecs pouvant entrer dans la maison La première griffe mécanique ! Yuanluobao est apparu à la World Robot Conference 2024 et a lancé le premier robot d'échecs pouvant entrer dans la maison Aug 21, 2024 pm 07:33 PM

Le 21 ao?t, la Conférence mondiale sur les robots 2024 s'est tenue en grande pompe à Pékin. La marque de robots domestiques de SenseTime, "Yuanluobot SenseRobot", a dévoilé toute sa famille de produits et a récemment lancé le robot de jeu d'échecs Yuanluobot AI - Chess Professional Edition (ci-après dénommé "Yuanluobot SenseRobot"), devenant ainsi le premier robot d'échecs au monde pour le maison. En tant que troisième produit robot jouant aux échecs de Yuanluobo, le nouveau robot Guoxiang a subi un grand nombre de mises à niveau techniques spéciales et d'innovations en matière d'IA et de machines d'ingénierie. Pour la première fois, il a réalisé la capacité de ramasser des pièces d'échecs en trois dimensions. grace à des griffes mécaniques sur un robot domestique et effectuer des fonctions homme-machine telles que jouer aux échecs, tout le monde joue aux échecs, réviser la notation, etc.

Claude aussi est devenu paresseux ! Internaute?: apprenez à vous accorder des vacances Claude aussi est devenu paresseux ! Internaute?: apprenez à vous accorder des vacances Sep 02, 2024 pm 01:56 PM

La rentrée scolaire est sur le point de commencer, et ce ne sont pas seulement les étudiants qui sont sur le point de commencer le nouveau semestre qui doivent prendre soin d’eux-mêmes, mais aussi les grands modèles d’IA. Il y a quelque temps, Reddit était rempli d'internautes se plaignant de la paresse de Claude. ? Son niveau a beaucoup baissé, il fait souvent des pauses et même la sortie devient très courte. Au cours de la première semaine de sortie, il pouvait traduire un document complet de 4 pages à la fois, mais maintenant il ne peut même plus produire une demi-page. !" https://www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/ dans un post intitulé "Totalement dé?u par Claude", plein de

L'équipe de Li Feifei a proposé ReKep pour donner aux robots une intelligence spatiale et intégrer GPT-4o L'équipe de Li Feifei a proposé ReKep pour donner aux robots une intelligence spatiale et intégrer GPT-4o Sep 03, 2024 pm 05:18 PM

Intégration profonde de la vision et de l'apprentissage des robots. Lorsque deux mains de robot travaillent ensemble en douceur pour plier des vêtements, verser du thé et emballer des chaussures, associées au robot humano?de 1X NEO qui a fait la une des journaux récemment, vous pouvez avoir le sentiment : nous semblons entrer dans l'ère des robots. En fait, ces mouvements soyeux sont le produit d’une technologie robotique avancée + d’une conception de cadre exquise + de grands modèles multimodaux. Nous savons que les robots utiles nécessitent souvent des interactions complexes et exquises avec l’environnement, et que l’environnement peut être représenté comme des contraintes dans les domaines spatial et temporel. Par exemple, si vous souhaitez qu'un robot verse du thé, le robot doit d'abord saisir la poignée de la théière et la maintenir verticalement sans renverser le thé, puis la déplacer doucement jusqu'à ce que l'embouchure de la théière soit alignée avec l'embouchure de la tasse. , puis inclinez la théière selon un certain angle. ce

Conférence sur l'intelligence artificielle distribuée Appel à communications DAI 2024 : Agent Day, Richard Sutton, le père de l'apprentissage par renforcement, sera présent ! Yan Shuicheng, Sergey Levine et les scientifiques de DeepMind prononceront des discours d'ouverture Conférence sur l'intelligence artificielle distribuée Appel à communications DAI 2024 : Agent Day, Richard Sutton, le père de l'apprentissage par renforcement, sera présent ! Yan Shuicheng, Sergey Levine et les scientifiques de DeepMind prononceront des discours d'ouverture Aug 22, 2024 pm 08:02 PM

Introduction à la conférence Avec le développement rapide de la science et de la technologie, l'intelligence artificielle est devenue une force importante dans la promotion du progrès social. à notre époque, nous avons la chance d’être témoins et de participer à l’innovation et à l’application de l’intelligence artificielle distribuée (DAI). L’intelligence artificielle distribuée est une branche importante du domaine de l’intelligence artificielle, qui a attiré de plus en plus d’attention ces dernières années. Les agents basés sur de grands modèles de langage (LLM) ont soudainement émergé. En combinant les puissantes capacités de compréhension du langage et de génération des grands modèles, ils ont montré un grand potentiel en matière d'interaction en langage naturel, de raisonnement par connaissances, de planification de taches, etc. AIAgent reprend le grand modèle de langage et est devenu un sujet br?lant dans le cercle actuel de l'IA. Au

Hongmeng Smart Travel S9 et conférence de lancement de nouveaux produits avec scénario complet, un certain nombre de nouveaux produits à succès ont été lancés ensemble Hongmeng Smart Travel S9 et conférence de lancement de nouveaux produits avec scénario complet, un certain nombre de nouveaux produits à succès ont été lancés ensemble Aug 08, 2024 am 07:02 AM

Cet après-midi, Hongmeng Zhixing a officiellement accueilli de nouvelles marques et de nouvelles voitures. Le 6 ao?t, Huawei a organisé la conférence de lancement de nouveaux produits Hongmeng Smart Xingxing S9 et Huawei, réunissant la berline phare intelligente panoramique Xiangjie S9, le nouveau M7Pro et Huawei novaFlip, MatePad Pro 12,2 pouces, le nouveau MatePad Air, Huawei Bisheng With de nombreux nouveaux produits intelligents tous scénarios, notamment la série d'imprimantes laser X1, FreeBuds6i, WATCHFIT3 et l'écran intelligent S5Pro, des voyages intelligents, du bureau intelligent aux vêtements intelligents, Huawei continue de construire un écosystème intelligent complet pour offrir aux consommateurs une expérience intelligente du Internet de tout. Hongmeng Zhixing : Autonomisation approfondie pour promouvoir la modernisation de l'industrie automobile intelligente Huawei s'associe à ses partenaires de l'industrie automobile chinoise pour fournir

Annonce des prix ACL 2024?: l'un des meilleurs articles sur le déchiffrement Oracle par HuaTech, GloVe Time Test Award Annonce des prix ACL 2024?: l'un des meilleurs articles sur le déchiffrement Oracle par HuaTech, GloVe Time Test Award Aug 15, 2024 pm 04:37 PM

Les contributeurs ont beaucoup gagné de cette conférence ACL. L'ACL2024, d'une durée de six jours, se tient à Bangkok, en Tha?lande. ACL est la plus grande conférence internationale dans le domaine de la linguistique informatique et du traitement du langage naturel. Elle est organisée par l'Association internationale pour la linguistique informatique et a lieu chaque année. L'ACL s'est toujours classée première en termes d'influence académique dans le domaine de la PNL, et c'est également une conférence recommandée par le CCF-A. La conférence ACL de cette année est la 62e et a re?u plus de 400 travaux de pointe dans le domaine de la PNL. Hier après-midi, la conférence a annoncé le meilleur article et d'autres récompenses. Cette fois, il y a 7 Best Paper Awards (deux inédits), 1 Best Theme Paper Award et 35 Outstanding Paper Awards. La conférence a également décerné 3 Resource Paper Awards (ResourceAward) et Social Impact Award (

Lors de la World Robot Conference, ce robot domestique porteur de ? l'espoir des futurs soins aux personnes agées ? a été entouré Lors de la World Robot Conference, ce robot domestique porteur de ? l'espoir des futurs soins aux personnes agées ? a été entouré Aug 22, 2024 pm 10:35 PM

Lors de la World Robot Conference qui se tient à Pékin, l'exposition de robots humano?des est devenue le centre absolu de la scène. Sur le stand Stardust Intelligent, l'assistant robot IA S1 a réalisé trois performances majeures de dulcimer, d'arts martiaux et de calligraphie. un espace d'exposition, capable à la fois d'arts littéraires et martiaux, a attiré un grand nombre de publics professionnels et de médias. Le jeu élégant sur les cordes élastiques permet au S1 de démontrer un fonctionnement fin et un contr?le absolu avec vitesse, force et précision. CCTV News a réalisé un reportage spécial sur l'apprentissage par imitation et le contr?le intelligent derrière "Calligraphy". Le fondateur de la société, Lai Jie, a expliqué que derrière les mouvements soyeux, le c?té matériel recherche le meilleur contr?le de la force et les indicateurs corporels les plus humains (vitesse, charge). etc.), mais du c?té de l'IA, les données réelles de mouvement des personnes sont collectées, permettant au robot de devenir plus fort lorsqu'il rencontre une situation forte et d'apprendre à évoluer rapidement. Et agile

See all articles