


Dépassant considérablement la SFT, le secret derrière O1 / Deepseek-R1 peut également être utilisé dans les grands modèles multimodaux
Mar 12, 2025 pm 01:03 PMDes chercheurs de l'Université de Shanghai Jiaotong, de Shanghai AI Lab et de l'Université chinoise de Hong Kong ont lancé le projet open source visual-RFT (visual d'amélioration), qui ne nécessite qu'une petite quantité de données pour améliorer considérablement les performances des mockups du langage visuel (LVLM). Visual-RFT combine intelligemment l'approche d'apprentissage en renforcement basée sur les règles de Deepseek-R1 avec le paradigme de relachement de renforcement d'OpenAI (RFT), prolongeant avec succès cette approche du champ de texte au champ visuel.
En concevant les récompenses de règles correspondantes pour des taches telles que la sous-catégorisation visuelle et la détection d'objets, Visual-RFT surmonte les limites de la méthode Deepseek-R1 limitée au texte, au raisonnement mathématique et à d'autres domaines, fournissant une nouvelle fa?on de formation LVLM.
Avantages de Visual-RFT:
Par rapport aux méthodes de réglage de réglage des instructions visuelles traditionnelles (SFT), Visual-RFT présente les avantages significatifs suivants:
- Moins d'échantillons d'apprentissage: seulement 10 à 1000 données peuvent être utilisées pour atteindre un réglage fin efficace.
- Généralisation plus forte: dans les scénarios avec des données limitées, les performances sont meilleures que SFT.
Les chercheurs ont vérifié la RFT visuelle sur plusieurs taches de perception visuelle (détection, classification, emplacement, etc.), et les résultats ont montré que le RFT visuel a réalisé des améliorations de performances significatives et facilement un transfert de capacités, même dans les milieux du vocabulaire ouvert et de l'apprentissage de petits échantillons.
Les chercheurs ont con?u des récompenses vérifiables correspondantes pour différentes taches: des récompenses basées sur l'IOU sont utilisées pour les taches de détection et de positionnement, et les récompenses basées sur l'exactitude de la classification sont utilisées pour les taches de classification.
Dans la tache de positionnement d'inférence, Visual-RFT montre de fortes capacités de raisonnement visuel, comme l'identification avec précision de lunettes imperméables que les athlètes doivent porter en images.
Résultats expérimentaux:
Des expériences basées sur le modèle QWEN2-VL 2B / 7B montrent que Visual-RFT est supérieur à SFT dans la détection d'objets ouverts, la détection de petits échantillons, la classification à grains fins et les taches de positionnement d'inférence. Même si vous détectez un caractère d'anime spécifique (comme Slime), Visual-RFT peut être réalisé avec juste une petite quantité de données.
Informations open source:
Le projet Visual-RFT est open source et contient une formation, un code d'évaluation et des données.
Adresse du projet: http://m.miracleart.cn/link/ec56522bc9c2e15be17d11962eeec453
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undress AI Tool
Images de déshabillage gratuites

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
échangez les visages dans n'importe quelle vidéo sans effort grace à notre outil d'échange de visage AI entièrement gratuit?!

Article chaud

Outils chauds

Bloc-notes++7.3.1
éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Le modèle dans le champ de la cha?ne publique montre une tendance de "un super, beaucoup de forts et une centaine de fleurs fleurissant". Ethereum mène toujours avec ses douves écologiques, tandis que Solana, Avalanche et d'autres sont difficiles à affronter les performances. Pendant ce temps, Polkadot, Cosmos, qui se concentre sur l'interopérabilité, et ChainLink, qui est une infrastructure critique, forment une image future de plusieurs cha?nes coexistant. Pour les utilisateurs et les développeurs, le choix de la plate-forme n'est plus un seul choix, mais nécessite un compromis entre les performances, le co?t, la sécurité et la maturité écologique basée sur des besoins spécifiques.

La mise à niveau de Fork Hard Fork de Cardano a réussi à transformer Cardano d'un réseau de transfert de valeur vers une plate-forme de contrat intelligent entièrement fonctionnel en introduisant la plate-forme de contrat intelligent Plutus. 1. Plutus est basé sur le langage Haskell, avec des fonctionnalités puissantes, une sécurité améliorée et un modèle de co?t prévisible; 2. Après la mise à niveau, le déploiement DAPPS est accéléré, la communauté des développeurs est élargie et les écosystèmes Defi et NFT se développent rapidement; 3. En 2025, l'écosystème de Cardano sera plus mature et diversifié. Combinée à l'amélioration de l'évolutivité à l'ère Basho, à l'amélioration de l'interopérabilité transversale, à l'évolution de la gouvernance décentralisée à l'ère Voltaire et à la promotion de l'adoption générale par les applications au niveau de l'entreprise, Cardano a

Pour afficher l'historique Git Commit, utilisez la commande gitlog. 1. L'utilisation de base est Gitlog, qui peut afficher le hachage de soumission, l'auteur, la date et les informations de soumission; 2. Utilisez Gitlog - Online pour obtenir une vue concise; 3. Filtre par l'auteur ou les informations de soumission via - Auteur et --Grep; 4. Ajouter -P pour afficher les modifications de code, - stat pour afficher les statistiques de changement; 5. Utilisez - GRAPH et - TOUT pour afficher l'historique de la branche, ou utiliser des outils de visualisation tels que Gitkraken et VScode.

Les 20 principaux actifs de cryptographie les plus prometteurs en 2025 comprennent BTC, ETH, SOL, etc., couvrant principalement plusieurs pistes telles que les cha?nes publiques, la couche 2, l'IA, le défi et les jeux. 1.BTC continue de diriger le marché avec ses propriétés numériques en métal jaune et sa vulgarisation des ETF; 2.eth consolide l'écosystème en raison de son statut et de sa mise à niveau des plates-formes de contrat intelligentes; 3.Sol se démarque avec des cha?nes publiques et des communautés de développeurs hautes performances; 4.Link est le leader d'Oracle Connectation de données réelles; 5.RNDR construit les besoins décentralisés du service de réseau GPU AI; 6.IMX se concentre sur les jeux Web3 pour fournir un environnement sans gaz zéro; 7.Reb mène avec la technologie de la couche 2 mature et l'énorme écosystème Defi; 8.Matic est devenu la couche de valeur d'Ethereum à travers l'évolution multi-cha?ne

La différence de base entre l'USDC, le DAI et le TUSD réside dans le mécanisme d'émission, les actifs collatéraux et les caractéristiques du risque. 1. L'USDC est un stablecoin centralisé émis par Circle et est garanti par des obligations de trésorerie en espèces et à court terme. Ses avantages sont la conformité et les liquidités transparentes, fortes et une stabilité élevée, mais il existe un risque d'examen centralisé et de défaillance ponctuelle; 2. Dai est une stablecoin décentralisée, générée par le protocole Makerdao, et la garantie est un atout crypto. Il présente les avantages de l'anti-censure, de la transparence sur la cha?ne et sans autorisation, mais il fait également face à des risques systémiques, à la dépendance à l'égard des actifs centralisés et des problèmes de complexité; 3. TUSD est un stablecoin centralisé, mettant l'accent sur la preuve de réserve en ligne en temps réel, fournissant une vérification de transparence de fréquence plus élevée, mais a une petite part de marché et une faible liquidité. Les trois sont des types de garantie et une décentralisation

Pour supprimer une branche GIT, assurez-vous d'abord qu'elle a été fusionnée ou aucune rétention n'est requise. Utilisez Gitbranch-D pour supprimer la branche fusionnée locale. Si vous devez forcer la suppression des branches non fusionnées, utilisez le paramètre -D. La suppression de branche à distance utilise la commande gitpushorigin-selebranch-name et peut synchroniser les référentiels locaux des autres via Gitfetch-prne. 1. Pour supprimer la branche locale, vous devez confirmer si elle a été fusionnée; 2. Pour supprimer la branche distante, vous devez utiliser le paramètre - Delete; 3. Après la suppression, vous devez vérifier si la branche est supprimée avec succès; 4. Communiquez avec l'équipe pour éviter de supprimer accidentellement des succursales partagées; 5. Nettoyez régulièrement les branches inutiles pour garder l'entrep?t propre.

à une époque où la vague de l'économie numérique a balayé le monde, les crypto-monnaies sont devenues l'attention de tous les horizons avec leur décentralisation et leur transparence uniques. De la première expérience de niche de geek au paysage financier actuel avec une valeur marchande de milliards de milliards, l'évolution des crypto-monnaies est incroyable. Il apporte non seulement des innovations dans les technologies sous-jacentes, mais donne également naissance à d'innombrables applications innovantes, qui affectent profondément tous les aspects de la finance, de la technologie et même de la gouvernance sociale.

Récemment, la discussion dans le domaine des actifs numériques est restée chaude. Dogecoin Doge, comme l'une des objectifs les plus populaires, est devenue une question que beaucoup de gens ont exploré. Où est-ce que cela "se stabilise"? Quelle est la relation avec la plateforme de trading actuelle, Binance? Pour répondre à ces questions, nous devons effectuer une analyse approfondie des deux dimensions de la logique technique sous-jacente des actifs numériques et de l'écologie de la plate-forme, plut?t que de rester en apparence.
