


Das Geheimnis hinter O1/Deepseek-R1 kann auch in multimodalen gro?en Modellen verwendet werden
Mar 12, 2025 pm 01:03 PMForscher der Shanghai Jiaotong University, des Shanghai AI Lab und der chinesischen Universit?t von Hongkong haben das Open-Source-Projekt zur visuellen RFT (visuelle Verbesserung der Feinabstimmung) gestartet, für das nur eine geringe Datenmenge erforderlich ist, um die Leistung von Visual Language Mockups (LVLM) signifikant zu verbessern. Visual-RFT kombiniert geschickt die regelbasierte Verst?rkungslernansatz von Deepseek-R1 mit dem RFT-Paradigma (Verst?rkung der Verst?rkung der Verst?rkung) und erweitert diesen Ansatz erfolgreich vom Textfeld auf das Gesichtsfeld.
Durch die Gestaltung der entsprechenden Regelpr?mien für Aufgaben wie die visuelle Unterkategorisierung und Objekterkennung überwindet die visuelle RFT die Einschr?nkungen der Deepseek-R1-Methode, die auf Text, mathematisches Denken und andere Bereiche beschr?nkt ist und eine neue M?glichkeit für das LVLM-Training bietet.
Vorteile von Visual-RFT:
Im Vergleich zu herk?mmlichen Methoden zur Feinabstimmung der visuellen Unterricht (SFT) hat Visual-RFT die folgenden erheblichen Vorteile:
- Weniger Probenlernf?higkeit: Nur 10 bis 1000 Datenstücke k?nnen verwendet werden, um eine effektive Feinabstimmung zu erreichen.
- St?rkere Verallgemeinerung: In Szenarien mit begrenzten Daten ist die Leistung besser als SFT.
Die Forscher verifizierten die visuelle RFT bei mehreren visuellen Wahrnehmungsaufgaben (Erkennung, Klassifizierung, Standort usw.), und die Ergebnisse zeigten, dass die visuelle RFT signifikante Leistungsverbesserungen erzielte und auch unter den Einstellungen des offenen Vokabulars und des kleinen Probenlernens leicht erreichbar war.
Die Forscher entwickelten entsprechende überprüfbare Belohnungen für verschiedene Aufgaben: IOU-basierte Belohnungen werden zur Erkennungs- und Positionierungsaufgaben verwendet, und für Klassifizierungsaufgaben werden Belohnungen der Klassifizierungskorrektheit verwendet.
Bei der Inferenzpositionierungsaufgabe zeigt Visual-RFT starke Funktionen für visuelle Argumentation, z.
Experimentelle Ergebnisse:
Experimente, die auf dem QWEN2-VL 2B/7B-Modell basieren, zeigen, dass die Visual-RFT SFT bei offener Objekterkennung, kleiner Probenerkennung, feink?rniger Klassifizierung und Inferenzpositionierungsaufgaben überlegen ist. Selbst wenn Sie einen bestimmten Anime-Charakter (z. B. Schleim) erkennen, kann Visual-RFT mit nur geringer Datenmenge erreicht werden.
Open Source -Informationen:
Das Visual-RFT-Projekt ist Open Source und enth?lt Schulungen, Bewertungscode und Daten.
Projektadresse: http://m.miracleart.cn/link/ec56522bc9c2e15be17d11962eec453
Das obige ist der detaillierte Inhalt vonDas Geheimnis hinter O1/Deepseek-R1 kann auch in multimodalen gro?en Modellen verwendet werden. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Hei?e KI -Werkzeuge

Undress AI Tool
Ausziehbilder kostenlos

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem v?llig kostenlosen KI-Gesichtstausch-Tool aus!

Hei?er Artikel

Hei?e Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Hei?e Themen

Mit dem Aufnehmen der Marktbedingungen haben immer mehr intelligente Investoren begonnen, ihre Positionen im W?hrungskreis leise zu erh?hen. Viele Menschen fragen sich, was sie entschlossen einnehmen l?sst, wenn die meisten Menschen warten und sehen? In diesem Artikel wird aktuelle Trends durch On-Chain-Daten analysiert, um die Leser zu helfen, die Logik von Smart Funds zu verstehen, um die n?chste Runde potenzieller Wachstumschancen besser zu erfassen.

Das Muster im ?ffentlichen Kettenfeld zeigt einen Trend von "One Super, vielen starken und hundert Blumen blühen". Ethereum führt immer noch mit seinem ?kologischen Wassergraben, w?hrend Solana, Avalanche und andere die Leistung herausfordern. In der Zwischenzeit bilden Polkadot, Cosmos, das sich auf die Interoperabilit?t konzentriert, und Chainlink, eine kritische Infrastruktur, ein zukünftiges Bild mehrerer Ketten, die nebeneinander existieren. Für Benutzer und Entwickler ist die Auswahl der Plattform keine einzige Wahl mehr, sondern erfordert einen Kompromiss zwischen Leistung, Kosten, Sicherheit und ?kologischer Reife, die auf spezifischen Anforderungen basieren.

Vor kurzem schlug Bitcoin einen neuen High, Dogecoin, der einen starken Abpraller eingeleitet hat und der Markt war hei?. Als n?chstes werden wir die Markttreiber und technischen Aspekte analysieren, um festzustellen, ob Ethereum noch die M?glichkeit hat, dem Anstieg zu folgen.

Stablecoins sind Kryptow?hrungen, die sich an Verm?genswerte wie den US -Dollar befassen und den stabilen Wert aufrechterhalten m?chten. Sie sind haupts?chlich in drei Arten unterteilt: Kollateral der Fiat -W?hrung, Kryptow?hrungskollateral und Algorithmen. 1. Fiat -W?hrungskollateral -Typen wie USDT und USCD werden von US -Dollar -Reserven unterstützt. 2. Kollateral-Typen wie DAI müssen andere W?hrungen zu überkollieren; 3. Algorithmus stützt sich auf intelligente Vertr?ge, um die Versorgung anzupassen, aber hohe Risiken. Zu den Gründen, warum es auf Plattformen wie Douyin hei? diskutiert wird, geh?ren: als Absicherungsinstrument, wenn der Kryptomarkt f?llt, eine Brücke für Anf?nger, um in die Krypto-Welt einzutreten, ein Weg, um ein hochkar?tiges Finanzmanagement in Defi zu erhalten, und die Anwendung von günstigen grenzüberschreitenden Zahlungen. Um Stablecoins zu erhalten, k?nnen Sie über den Mainstream -Austausch wie Binance, Ouyi und Huobi handeln.

Das Alonzo Hard -Fork -Upgrade von Cardano hat Cardano erfolgreich von einem Value Transfer -Netzwerk auf eine voll funktionsf?hige Smart Contract -Plattform verwandelt, indem die Plutus Smart Contract -Plattform eingeführt wird. 1. Plutus basiert auf Haskell -Sprache mit leistungsstarker Funktionalit?t, verbesserter Sicherheit und vorhersehbarem Kostenmodell. 2. Nach dem Upgrade wird die DAPPS -Bereitstellung beschleunigt, die Entwicklergemeinschaft wird erweitert und die Defi- und NFT -?kosysteme entwickeln sich rasant. 3. Das Cardano -?kosystem im Jahr 2025 wird reifer und vielf?ltiger sein. In Kombination mit der Verbesserung der Skalierbarkeit in der Basho-?ra, der Verbesserung der interoperischen Interoperabilit?t, der Entwicklung der dezentralen Governance in der Voltaire-?ra und der F?rderung der Mainstream-Einführung durch Anwendungen auf Unternehmensebene hat Cardano Cardano hat

Die fünf wertvollsten Stablecoins im Jahr 2025 sind Tether (USDT), USD Coin (USDC), DAI (DAI), First Digital USD (FDUSD) und TrueUSD (TUSD).

Stablecoins sind Krypto -Verm?genswerte, die die Preisstabilit?t aufrechterhalten, indem sie Fiat -W?hrungen wie den US -Dollar verankern. Sie sind haupts?chlich in drei Kategorien unterteilt: Fiat -W?hrungskollateral-, Krypto -Kollateral- und Algorithmic Stablecoins. 1. USDT wird von Tether ausgestellt und ist der Stablecoin mit dem gr??ten Marktwert und der h?chsten Liquidit?t. 2. USDC wird von der Center Alliance von Circle and Coinbase ver?ffentlicht und ist bekannt für seine Transparenz und Konformit?t. 3. DAI wird von Makerdao durch überkollateralisierung von Krypto-Verm?genswerten erzeugt und ist die Kernw?hrung im Defi-Feld. V. 5. TUSD erreicht eine hohe Transparenzreserve-überprüfung durch Drittanbieter-Treuhandkonten. Benutzer k?nnen zentralisierten B?rsen wie Binance, Ouyi und Huobi verwenden

Zu den 20 vielversprechendsten Krypto -Assets im Jahr 2025 geh?ren BTC, ETH, SOL usw., die haupts?chlich mehrere Spuren wie ?ffentliche Ketten, Schicht 2, AI, Defi und Gaming abdecken. 1.BTC führt weiterhin den Markt mit seinen digitalen gelben Metalleigenschaften und der Popularisierung von ETFs an. 2.Th konsolidiert das ?kosystem aufgrund seines Status und der Upgrade von intelligenten Vertragsplattformen; 3.Sol zeichnet sich mit leistungsstarken ?ffentlichen Ketten und Entwicklergemeinschaften aus. 4.Link ist führend in Oracle, das reale Daten verbindet. 5.RNDR erstellt dezentrale GPU -Netzwerkdienstanforderungen. 6.Imx konzentriert sich auf Web3-Spiele, um eine null-gasfreie Umgebung zu bieten. 7.ARB führt mit der reifen Technologie 2 und dem riesigen Defi -?kosystem; 8.Matic ist zur Wertschicht von Ethereum durch Multi-Chain-Evolution geworden
