国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

首頁(yè) 科技周邊 人工智能 視覺強(qiáng)化微調(diào)!DeepSeek R1技術(shù)成功遷移到多模態(tài)領(lǐng)域,全面開源

視覺強(qiáng)化微調(diào)!DeepSeek R1技術(shù)成功遷移到多模態(tài)領(lǐng)域,全面開源

Mar 12, 2025 pm 01:12 PM
git ai 郵箱 產(chǎn)業(yè) 寶可夢(mèng) DeepSeek 視覺強(qiáng)化 qwen

重磅推薦:Visual-RFT——視覺強(qiáng)化微調(diào)開源項(xiàng)目,賦能視覺語(yǔ)言模型!

視覺強(qiáng)化微調(diào)!DeepSeek R1技術(shù)成功遷移到多模態(tài)領(lǐng)域,全面開源

AIxiv專欄持續(xù)關(guān)注全球頂尖AI研究,已發(fā)布2000余篇學(xué)術(shù)技術(shù)文章。歡迎投稿分享您的優(yōu)秀成果!投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com

Visual-RFT (Visual Reinforcement Fine-Tuning) 項(xiàng)目,將基于規(guī)則獎(jiǎng)勵(lì)的強(qiáng)化學(xué)習(xí)與強(qiáng)化微調(diào)(RFT)范式成功應(yīng)用于視覺語(yǔ)言大模型(LVLM),突破了以往方法僅限于文本、數(shù)學(xué)等領(lǐng)域的局限。通過(guò)為視覺細(xì)分類、目標(biāo)檢測(cè)等任務(wù)設(shè)計(jì)特定規(guī)則獎(jiǎng)勵(lì),Visual-RFT 為L(zhǎng)VLM訓(xùn)練提供了全新思路!

圖1展示了Visual-RFT的強(qiáng)大泛化能力:模型僅需少量數(shù)據(jù),便能準(zhǔn)確識(shí)別視覺強(qiáng)化微調(diào)!DeepSeek R1技術(shù)成功遷移到多模態(tài)領(lǐng)域,全面開源中特定寶可夢(mèng)并定位其坐標(biāo)。

視覺強(qiáng)化微調(diào)!DeepSeek R1技術(shù)成功遷移到多模態(tài)領(lǐng)域,全面開源

圖1. Visual-RFT 將強(qiáng)化微調(diào)擴(kuò)展到多模態(tài),只需10-1000條數(shù)據(jù)即可顯著提升模型性能。

從RFT到Visual-RFT:強(qiáng)化學(xué)習(xí)在多模態(tài)領(lǐng)域的突破

OpenAI的強(qiáng)化微調(diào)技術(shù),只需少量樣本即可實(shí)現(xiàn)模型能力遷移。 DeepSeek-R1揭示了其強(qiáng)大的推理能力源于基于可驗(yàn)證獎(jiǎng)勵(lì)的強(qiáng)化學(xué)習(xí)策略。然而,該策略此前主要應(yīng)用于文本、數(shù)學(xué)等領(lǐng)域。 Visual-RFT將此策略成功拓展至視覺領(lǐng)域,通過(guò)構(gòu)建可驗(yàn)證規(guī)則獎(jiǎng)勵(lì),解決了傳統(tǒng)方法在視覺領(lǐng)域的局限性,實(shí)現(xiàn)高效、高泛化性的視覺理解與推理。

傳統(tǒng)的視覺指令微調(diào)(SFT)需要大量數(shù)據(jù),而Visual-RFT的少樣本學(xué)習(xí)能力使其在數(shù)據(jù)稀缺場(chǎng)景下更具優(yōu)勢(shì)。

為了驗(yàn)證Visual-RFT的泛化能力,研究團(tuán)隊(duì)在目標(biāo)檢測(cè)、分類、 grounding等多個(gè)視覺任務(wù)上進(jìn)行了測(cè)試。結(jié)果顯示,Visual-RFT在開放詞匯、少樣本學(xué)習(xí)等設(shè)定下,僅需少量數(shù)據(jù)即可實(shí)現(xiàn)顯著性能提升,并優(yōu)于SFT方法。尤其在推理定位任務(wù)中,Visual-RFT展現(xiàn)出卓越的視覺推理能力。 (詳見論文)

視覺強(qiáng)化微調(diào)!DeepSeek R1技術(shù)成功遷移到多模態(tài)領(lǐng)域,全面開源

圖2. Visual-RFT在多個(gè)視覺任務(wù)上顯著超越SFT。

視覺強(qiáng)化微調(diào)!DeepSeek R1技術(shù)成功遷移到多模態(tài)領(lǐng)域,全面開源

圖3. Visual-RFT框架圖,利用IoU和cls獎(jiǎng)勵(lì)以及強(qiáng)化學(xué)習(xí)策略更新模型參數(shù)。

研究團(tuán)隊(duì)使用基于IoU的可驗(yàn)證獎(jiǎng)勵(lì)用于檢測(cè)和grounding任務(wù),使用基于分類正確性的cls獎(jiǎng)勵(lì)用于分類任務(wù)。 (如圖3所示)

視覺強(qiáng)化微調(diào)!DeepSeek R1技術(shù)成功遷移到多模態(tài)領(lǐng)域,全面開源

圖4. 推理定位結(jié)果展示,Visual-RFT超越SFT,更精準(zhǔn)地定位物體。

視覺強(qiáng)化微調(diào)!DeepSeek R1技術(shù)成功遷移到多模態(tài)領(lǐng)域,全面開源

圖5. 推理細(xì)粒度分類結(jié)果展示,Visual-RFT超越SFT,更精準(zhǔn)地定位物體。

圖4和圖5展示了模型輸出結(jié)果,Visual-RFT通過(guò)強(qiáng)化學(xué)習(xí)策略,進(jìn)行深入的推理分析,取得了優(yōu)于SFT的性能。

Visual-RFT實(shí)驗(yàn)結(jié)果

基于QWen2-VL 2B/7B模型,Visual-RFT在開放目標(biāo)檢測(cè)、少樣本檢測(cè)、細(xì)粒度分類和推理定位任務(wù)上全面超越SFT。實(shí)驗(yàn)數(shù)據(jù)涵蓋COCO、LVIS等通用場(chǎng)景和互聯(lián)網(wǎng)卡通人物等開放場(chǎng)景。僅需少量數(shù)據(jù),Visual-RFT即可實(shí)現(xiàn)能力遷移,展現(xiàn)出卓越的性能和魯棒性。

視覺強(qiáng)化微調(diào)!DeepSeek R1技術(shù)成功遷移到多模態(tài)領(lǐng)域,全面開源

視覺強(qiáng)化微調(diào)!DeepSeek R1技術(shù)成功遷移到多模態(tài)領(lǐng)域,全面開源

圖5. 部分實(shí)驗(yàn)結(jié)果展示,Visual-RFT顯著超越SFT。

Visual-RFT已開源!

Visual-RFT項(xiàng)目已開源,包含訓(xùn)練、評(píng)估代碼和數(shù)據(jù)。歡迎參與!

項(xiàng)目地址: http://m.miracleart.cn/link/ec56522bc9c2e15be17d11962eeec453

以上是視覺強(qiáng)化微調(diào)!DeepSeek R1技術(shù)成功遷移到多模態(tài)領(lǐng)域,全面開源的詳細(xì)內(nèi)容。更多信息請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本站聲明
本文內(nèi)容由網(wǎng)友自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,本站不承擔(dān)相應(yīng)法律責(zé)任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容,請(qǐng)聯(lián)系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅(qū)動(dòng)的應(yīng)用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Clothoff.io

Clothoff.io

AI脫衣機(jī)

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智能換臉工具輕松在任何視頻中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強(qiáng)大的PHP集成開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁(yè)開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)代碼編輯軟件(SublimeText3)

即使可能快進(jìn),我如何創(chuàng)建合并提交? 即使可能快進(jìn),我如何創(chuàng)建合并提交? Jul 21, 2025 am 02:22 AM

使用gitmerge--no-ff可強(qiáng)制Git創(chuàng)建合并提交,即使可以快進(jìn)。1.使用--no-ff參數(shù)可保留分支歷史,明確變更來(lái)源;2.該方法在代碼審查或?qū)徲?jì)時(shí)特別有用,常用于GitFlow等嚴(yán)格分支策略;3.可通過(guò)配置別名或腳本自動(dòng)化此操作,如gitconfig--globalalias.merge-noff'!gitmerge--no-ff',從而簡(jiǎn)化流程。

如何從崇高文本中的遠(yuǎn)程存儲(chǔ)庫(kù)中提取更改? 如何從崇高文本中的遠(yuǎn)程存儲(chǔ)庫(kù)中提取更改? Jul 22, 2025 am 12:54 AM

YoucanpullchangesfromaremoterepositoryinSublimeTextusingpluginsortheterminal.1.InstallGitSavvyorSublimeGittoperformGittaskswithinSublime;GitSavvyisfreeandopen-sourcewhileSublimeGitoffersapolishedUI.2.AfterinstallingGitSavvy,usetheCommandPaletteorshor

山寨幣跨鏈交易的技術(shù)難點(diǎn)與解決方案 山寨幣跨鏈交易的技術(shù)難點(diǎn)與解決方案 Jul 22, 2025 pm 08:33 PM

跨鏈交易面臨共識(shí)機(jī)制差異、數(shù)據(jù)不可共享、原子性保障復(fù)雜、安全性問題和延遲成本高等技術(shù)難點(diǎn),1. 采用中繼網(wǎng)絡(luò)實(shí)現(xiàn)鏈間數(shù)據(jù)同步;2. 利用原子交換實(shí)現(xiàn)無(wú)中介資產(chǎn)互換;3. 通過(guò)跨鏈橋鎖定資產(chǎn)并生成映射代幣;4. 使用多鏈聚合協(xié)議整合流動(dòng)性;未來(lái)將通過(guò)增強(qiáng)安全性、推動(dòng)標(biāo)準(zhǔn)化接口、提升用戶體驗(yàn)和加強(qiáng)去中心化來(lái)優(yōu)化跨鏈生態(tài),為山寨幣的多鏈流通提供安全便捷的支持。

必安交易平臺(tái)App的官方途徑是什么 從官網(wǎng)注冊(cè)安裝必安App的具體操作流程 必安交易平臺(tái)App的官方途徑是什么 從官網(wǎng)注冊(cè)安裝必安App的具體操作流程 Jul 22, 2025 pm 06:24 PM

必安交易平臺(tái)下載安裝及注冊(cè)流程如下:1、點(diǎn)擊官方鏈接開始下載,遇安全提示請(qǐng)選擇允許;2、安裝時(shí)需在設(shè)置中“信任”該應(yīng)用以確保運(yùn)行;3、注冊(cè)時(shí)填寫郵箱或手機(jī)號(hào)并設(shè)置含字母、數(shù)字、特殊符號(hào)的密碼;4、登錄后立即綁定二次驗(yàn)證(2FA)并完成身份認(rèn)證以提升安全等級(jí)和權(quán)限,即可正常使用平臺(tái)功能。

成品python大片在線觀看入口 python免費(fèi)成品網(wǎng)站大全 成品python大片在線觀看入口 python免費(fèi)成品網(wǎng)站大全 Jul 23, 2025 pm 12:36 PM

本文為您精選了多個(gè)頂級(jí)的Python“成品”項(xiàng)目網(wǎng)站與高水平“大片”級(jí)學(xué)習(xí)資源入口。無(wú)論您是想尋找開發(fā)靈感、觀摩學(xué)習(xí)大師級(jí)的源代碼,還是系統(tǒng)性地提升實(shí)戰(zhàn)能力,這些平臺(tái)都是不容錯(cuò)過(guò)的寶庫(kù),能幫助您快速成長(zhǎng)為Python高手。

穩(wěn)定幣多少錢一枚 穩(wěn)定幣值多少錢 穩(wěn)定幣多少錢一枚 穩(wěn)定幣值多少錢 Jul 23, 2025 am 06:30 AM

穩(wěn)定幣是一種價(jià)值與特定資產(chǎn)掛鉤的加密貨幣,其價(jià)格通常與美元等法幣1:1錨定。1. 大多數(shù)穩(wěn)定幣通過(guò)法幣抵押、加密貨幣抵押或算法調(diào)節(jié)等機(jī)制維持價(jià)格穩(wěn)定;2. 主流穩(wěn)定幣如USDT、USDC采用法幣抵押方式;3. DAI屬于加密貨幣超額抵押類型;4. 算法穩(wěn)定幣則依賴智能合約調(diào)節(jié)供應(yīng)量;5. 查詢穩(wěn)定幣價(jià)格可通過(guò)主流交易所如幣安、歐易、火幣、Gate.io、Coinbase和Kraken獲取實(shí)時(shí)數(shù)據(jù)。

比特幣代號(hào)是什么?比特幣是什么樣式的代碼? 比特幣代號(hào)是什么?比特幣是什么樣式的代碼? Jul 22, 2025 pm 09:51 PM

比特幣作為數(shù)字世界的先驅(qū),其獨(dú)特的代號(hào)和底層技術(shù)一直是人們關(guān)注的焦點(diǎn)。它的標(biāo)準(zhǔn)代號(hào)是 BTC,在某些符合國(guó)際標(biāo)準(zhǔn)的平臺(tái)上也被稱為 XBT。從技術(shù)角度看,比特幣并非單一的代碼樣式,而是一個(gè)龐大且精密的開源軟件項(xiàng)目,其核心代碼主要由 C 語(yǔ)言編寫,并融合了密碼學(xué)、分布式系統(tǒng)和經(jīng)濟(jì)學(xué)原理,任何人都可以查看、審查和貢獻(xiàn)其代碼。

如何下載狗狗幣官方App?狗狗幣App使用指南 如何下載狗狗幣官方App?狗狗幣App使用指南 Jul 22, 2025 pm 11:36 PM

狗狗幣沒有官方App,用戶需通過(guò)第三方交易所進(jìn)行交易,本文推薦了6個(gè)平臺(tái)并提供使用步驟。1. 幣安:交易量大、功能全面;2. 歐易:集成賬戶與NFT市場(chǎng);3. 火幣:安全性高;4. Gate.io:幣種豐富;5. KuCoin:上幣速度快;6. Kraken:合規(guī)性強(qiáng)。下載需通過(guò)官方渠道,完成注冊(cè)、身份驗(yàn)證、充值、交易狗狗幣(DOGE)并保障賬戶安全,開啟2FA和設(shè)置復(fù)雜密碼。

See all articles