


Grok 4 accélère la course aux armements AI: progrès et périls non résolus
Jul 11, 2025 am 11:10 AMRaisonnement à l'échelle et le calcul du calcul
L'accent mis par Grok 4 sur l'amélioration du raisonnement, y compris les versions spécifiques au domaine, reflète un mouvement de l'industrie plus large vers des approches post-formation. L'architecture de Grok 4 illustre la direction du progrès dans la logique mathématique, la génération de code et le raisonnement scientifique. Par rapport à Grok 3, Grok 4 gère les requêtes en utilisant des séquences logiques plus complexes. Des variantes spécialisées comme le code GROK 4 s'adressent à des applications spécifiques, indiquant la fragmentation du marché, car les fournisseurs se concentrent davantage sur les performances spécifiques au domaine que les capacités générales. Selon Musk, ce changement aurait permis à Grok 4 d'atteindre le score le plus élevé jamais enregistré sur le ?dernier examen de l'humanité?, surpassant les modèles Gemini, GPT-4 et O3. Cette évaluation difficile, con?ue par des experts du domaine, présente plus de 100 problèmes couvrant des disciplines telles que les mathématiques, la chimie et la linguistique - dont la plupart sont insolubles par tout expert humain individuel.
Cette avancement, décrit par le chercheur principal de Grok 4, Jimmy Ba - un professeur de l'Université de Toronto et ancien étudiant de Geoffrey Hinton - tout en réalisant un ?taux de progrès ridicule? - se concentre sur l'utilisation par Xai de ressources informatiques approfondies dans le renforcement de l'apprentissage et de l'optimisation du raisonnement, plut?t que de se concentrer sur la pré-formation comme Grok 3.
Le supercalculateur Colossus de Xai était au c?ur de la formation de Grok 4, mettant en évidence la dépendance de l'industrie au matériel avancé. Des plans sont également en cours pour que XAI forment son modèle de génération vidéo en utilisant 100 000 GPU NVIDIA GB 200, capable de fournir des vitesses d'inférence jusqu'à 30 fois plus rapides que les systèmes précédents. Cela souligne comment l'IA de pointe nécessite désormais une infrastructure à forte intensité d'énergie. Avec l'accès à l'entreprise au prix de 300 $ / mois, le co?t de Grok 4 Heavy révèle la prime placée sur la puissance de calcul, tandis que les frais d'API (3 / millions de jetons d'entrée) reflètent la fa?on dont la pénurie de GPU influence les stratégies de commercialisation à travers le domaine. Le Grok 4 Heavy de niveau supérieur utilise plusieurs agents d'IA parallèles qui collaborent à travers un débat pour améliorer la résolution de problèmes complexes.
Ambitions du monde physique
Alors que Grok 4 manque actuellement de capacités de vision (prévue pour Grok 6/7), sa conception fait allusion aux ambitions de Xai dans le monde physique. Musk affirme que Grok 4 simulera les hypothèses et les validera dans des environnements réels, s'alignant avec des cadres de recherche émergents comme les modèles mondiaux et la robotique visant à traduire les sorties LLM en actions physiques. S'ils sont incorporés dans les robots humano?des Optimus de Tesla ou les véhicules autonomes, Grok 4 pourrait adapter et affiner ses réponses en fonction des données du monde réel.
Tensions non résolues: problèmes de sécurité et hallucinations
La sortie de Grok 4 est survenue peu de temps après que Grok 3 a déclenché la controverse en faisant l'éloge de Hitler et en produisant un contenu antisémite, révélant des risques continus. Bien que XAI ait supprimé les réponses problématiques de Grok 3 après le contrecoup public, aucune garantie technique claire n'a été annoncée pour Grok 4. Malgré les allégations de renseignement au niveau du doctorat, les chercheurs XAI n'ont pas résolu des problèmes communs de LLM tels que l'hallucination et les problèmes de sécurité lors de l'événement de lancement. Cette omission est particulièrement préoccupante pour un système destiné à la découverte de médicaments et à bient?t intégrée dans les robots et les voitures autonomes. Pendant ce temps, l'assistant vocal, qui parle dans divers tons, soulève des questions éthiques sur le mimétisme émotionnel qui brouille les frontières entre les humains et les machines.
Grok 4 cristallise quatre tendances remodelant l'IA. Premièrement, l'évolutivité dépend maintenant de la sécurisation des GPU et des centres informatiques hautes performances, en concentrant le pouvoir parmi les joueurs bien financés et en alimentant une course mondiale sur les armements du GPU. Deuxièmement, le leadership dans les références de raisonnement (par exemple, ARC-AGI) a dépassé les paramètres bruts qui comptent comme la mesure concurrentielle clé. Troisièmement, les progrès du contr?le robotique préparent les LLM pour l'action du monde réel. Quatrièmement, les modèles d'abonnement à plusieurs niveaux renforcent l'IA en tant que produit de luxe, élargissant potentiellement les lacunes de l'innovation et favorisant les utilisateurs des entreprises.
Le renseignement ?surhumain? de Grok 4 sert de conte éteint, illustrant comment la poursuite de l'efficacité des données a de loin dépassé le développement de cadres pour la sécurité, la transparence et l'accès équitable. Comme le prédit Musk, Grok ?découvrira les nouvelles technologies d'ici la fin de l'année prochaine?, le domaine est confronté à une question critique dans la course vers l'intelligence générale artificielle: pouvons-nous garantir que ces systèmes s'alignent sur les valeurs humaines avant de redéfinir les connaissances humaines?
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undress AI Tool
Images de déshabillage gratuites

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
échangez les visages dans n'importe quelle vidéo sans effort grace à notre outil d'échange de visage AI entièrement gratuit?!

Article chaud

Outils chauds

Bloc-notes++7.3.1
éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Rappelez-vous le flot de modèles chinois open source qui a perturbé l'industrie du Genai plus t?t cette année? Alors que Deepseek a fait la majeure partie des titres, Kimi K1.5 était l'un des noms importants de la liste. Et le modèle était assez cool.

à la mi-2025, l'AI ?Arme Race? se réchauffe, et Xai et Anthropic ont tous deux publié leurs modèles phares, Grok 4 et Claude 4.

Mais nous n'aurons probablement pas à attendre même 10 ans pour en voir un. En fait, ce qui pourrait être considéré comme la première vague de machines vraiment utiles, de type humain, est déjà là. Les dernières années ont vu un certain nombre de prototypes et de modèles de production sortant de T

Jusqu'à l'année précédente, l'ingénierie rapide était considérée comme une compétence cruciale pour interagir avec les modèles de langage grand (LLM). Récemment, cependant, les LLM ont considérablement progressé dans leurs capacités de raisonnement et de compréhension. Naturellement, nos attentes

Construit sur le moteur de profondeur neuronale propriétaire de Leia, l'application traite des images fixes et ajoute de la profondeur naturelle avec un mouvement simulé - comme les casseroles, les zooms et les effets de parallaxe - pour créer de courts bobines vidéo qui donnent l'impression de pénétrer dans le SCE

Imaginez quelque chose de sophistiqué, comme un moteur d'IA prêt à donner des commentaires détaillés sur une nouvelle collection de vêtements de Milan, ou une analyse de marché automatique pour une entreprise opérant dans le monde entier, ou des systèmes intelligents gérant une grande flotte de véhicules.

Une nouvelle étude de chercheurs du King’s College de Londres et de l’Université d’Oxford partage les résultats de ce qui s'est passé lorsque Openai, Google et Anthropic ont été jetés ensemble dans un concours fardé basé sur le dilemme du prisonnier itéré. Ce n'était pas

Les scientifiques ont découvert une méthode intelligente mais alarmante pour contourner le système. Juillet 2025 a marqué la découverte d'une stratégie élaborée où les chercheurs ont inséré des instructions invisibles dans leurs soumissions académiques - ces directives secrètes étaient la queue
