国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目錄
0. 這篇文章干了啥?
1. 論文信息
2. 摘要
3. 效果展示
4. 主要貢獻
5. 具體原理是啥?
6. 實驗結果
7. 總結
首頁 科技周邊 人工智能 開源!超越ZoeDepth! DepthFM:快速且精確的單目深度估計!

開源!超越ZoeDepth! DepthFM:快速且精確的單目深度估計!

Apr 03, 2024 pm 12:04 PM
數據 訓練

0. 這篇文章干了啥?

提出了DepthFM:一個多功能且快速的最先進的生成式單目深度估計模型。除了傳統的深度估計任務外,DepthFM還展示了在深度修復等下游任務中的最先進能力。DepthFM效率高,可以在少數推理步驟內合成深度圖。

下面一起來閱讀一下這項工作~

1. 論文信息

標題:DepthFM: Fast Monocular Depth Estimation with Flow Matching

作者:Ming Gui, Johannes S. Fischer, Ulrich Prestel, Pingchuan Ma, Dmytro Kotovenko, Olga Grebenkova, Stefan Andreas Baumann, Vincent Tao Hu, Bj?rn Ommer

機構:MCML

原文鏈接:https://arxiv.org/abs/2403.13788

代碼鏈接:https://github.com/CompVis/depth-fm

官方主頁:https://depthfm.github.io/

2. 摘要

針對許多下游觀光任務和應用至關重要。目前針對此問題的判別式方法受到模糊偽影的限制,而最先進的生成方法由于其SDE性質導致訓練樣本速度緩慢。我們不是從噪聲開始,而是尋求從輸入圖像到深度圖像的直接映射。我們觀察到這可通過流匹配來有效地構建,因為其在解空間中的直線軌跡提供了效率和高質量。我們的研究表明,預先訓練的圖像擴散模型可用于作為流匹配深度模型的充分先驗知識。在復雜自然場景的基準測試中,盡管僅在少量合成數據上進行訓練,我們的輕量級方法以有利的低計算成本表現出最先進的性能。

3. 效果展示

DepthFM是一種具有強零樣本泛化能力的快速推理流匹配模型,可利用強大的先驗知識,并且很容易地泛化到未知的真實圖像中。在合成數據上進行訓練后,模型可以很好地泛化到未知的真實圖像中,并對深度圖像進行精確匹配。

開源!超越ZoeDepth! DepthFM:快速且精確的單目深度估計!

與其他最先進的模型相比,DepthFM僅用一個函數評估就獲得了明顯更清晰的圖像。Marigold的深度估計耗時是DepthFM的兩倍,但無法生成相同粒度的深度圖。

開源!超越ZoeDepth! DepthFM:快速且精確的單目深度估計!

4. 主要貢獻

(1)提出了DepthFM,一種最先進的、多功能的、快速的單目深度估計模型。除了傳統的深度估計任務外,DepthFM還展示了在深度修補和深度條件圖像合成等下游任務中的最新能力。

(2)展示了將強大的圖像先驗從擴散模型成功轉移到流匹配模型,幾乎不依賴于訓練數據,也不需要真實世界的圖像。

(3)表明,流匹配模型高效,并能在單個推理步驟內合成深度圖。

(4)盡管僅在合成數據上進行訓練,但DepthFM在基準數據集和自然圖像上表現出色。

(5)將表面法線損失作為輔助目標,以獲得更準確的深度估計。

(6)除了深度估計,還可可靠地預測其預測的置信度。

5. 具體原理是啥?

訓練Pipeline。?訓練受到流匹配和表面法向損失的限制:對于流匹配,使用數據依賴的流匹配來回歸地面真實深度與對應圖像之間的向量場。此外,通過一個表面法向損失來實現幾何真實感。

開源!超越ZoeDepth! DepthFM:快速且精確的單目深度估計!

數據相關的流匹配:?DepthFM通過利用圖像到深度對,回歸出圖像分布和深度分布之間的直線向量場。這種方法在不犧牲性能的情況下促進了高效的幾步推理。

從擴散先驗微調:?作者展示了成功將強大的圖像先驗從基礎圖像合成擴散模型(Stable Diffusion v2-1)轉移到流匹配模型,幾乎不依賴訓練數據,并且不需要真實世界的圖像。

輔助表面法線損失:?考慮到DepthFM只在合成數據上進行訓練,大多數合成數據集提供了地面真實表面法線,將表面法線損失作為輔助目標,以增強DepthFM深度估計的準確性。

6. 實驗結果

DepthFM通過僅在63k純合成樣本上進行訓練展現出了顯著的泛化能力,并且能夠在室內外數據集上進行零- shot深度估計。表1定性地展示了DepthFM與最先進的對應模型的性能對比。雖然其他模型通常依賴于大量數據集進行訓練,但DepthFM利用了基于擴散的基礎模型中固有的豐富知識。這種方法不僅節(jié)省了計算資源,而且強調了模型的適應性和訓練效率。

開源!超越ZoeDepth! DepthFM:快速且精確的單目深度估計!

對基于擴散的Marigold深度估計、流匹配(FM)基準和DepthFM模型進行比較。每種方法僅使用一個集合成員進行評估,并針對兩個常見基準數據集進行不同數量的函數評估(NFE)。與FM基準相比,DepthFM集成了訓練過程中的法線損失和數據相關的耦合。

開源!超越ZoeDepth! DepthFM:快速且精確的單目深度估計!

對于Marigold和的DepthFM模型在不同數量的功能評估中的定性結果。值得注意的是,通過一步推斷,Marigold并沒有給出任何有意義的結果,而DepthFM的結果已經顯示了真實的深度圖。

開源!超越ZoeDepth! DepthFM:快速且精確的單目深度估計!

在Hypersim上進行深度補全。左:給予部分深度。中:深度估計從給定的部分深度。右:真值深度。

開源!超越ZoeDepth! DepthFM:快速且精確的單目深度估計!

7. 總結

DepthFM,一種用于單目深度估計的流匹配方法。通過學習輸入圖像和深度之間的直接映射,而不是將正態(tài)分布去噪為深度圖,該方法明顯比當前基于擴散的解決方案更高效,同時仍提供細粒度的深度圖,而不會出現判別式范式的常見偽影。 DepthFM使用預先訓練好的圖像擴散模型作為先驗,有效地轉移到了深度流匹配模型中。因此,DepthFM只在合成數據上進行了訓練,但在推斷期間仍然能很好地推廣到自然圖像。此外,輔助表面法線損失已被證明能改善深度估計。 DepthFM的輕量級方法具有競爭力,速度快,并提供可靠的置信度估計。

對更多實驗結果和文章細節(jié)感興趣的讀者,可以閱讀一下論文原文

以上是開源!超越ZoeDepth! DepthFM:快速且精確的單目深度估計!的詳細內容。更多信息請關注PHP中文網其他相關文章!

本站聲明
本文內容由網友自發(fā)貢獻,版權歸原作者所有,本站不承擔相應法律責任。如您發(fā)現有涉嫌抄襲侵權的內容,請聯系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅動的應用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Clothoff.io

Clothoff.io

AI脫衣機

Video Face Swap

Video Face Swap

使用我們完全免費的人工智能換臉工具輕松在任何視頻中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強大的PHP集成開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級代碼編輯軟件(SublimeText3)

使用ddrescue在Linux上恢復數據 使用ddrescue在Linux上恢復數據 Mar 20, 2024 pm 01:37 PM

DDREASE是一種用于從文件或塊設備(如硬盤、SSD、RAM磁盤、CD、DVD和USB存儲設備)恢復數據的工具。它將數據從一個塊設備復制到另一個塊設備,留下損壞的數據塊,只移動好的數據塊。ddreasue是一種強大的恢復工具,完全自動化,因為它在恢復操作期間不需要任何干擾。此外,由于有了ddasue地圖文件,它可以隨時停止和恢復。DDREASE的其他主要功能如下:它不會覆蓋恢復的數據,但會在迭代恢復的情況下填補空白。但是,如果指示工具顯式執(zhí)行此操作,則可以將其截斷。將數據從多個文件或塊恢復到單

開源!超越ZoeDepth! DepthFM:快速且精確的單目深度估計! 開源!超越ZoeDepth! DepthFM:快速且精確的單目深度估計! Apr 03, 2024 pm 12:04 PM

0.這篇文章干了啥?提出了DepthFM:一個多功能且快速的最先進的生成式單目深度估計模型。除了傳統的深度估計任務外,DepthFM還展示了在深度修復等下游任務中的最先進能力。DepthFM效率高,可以在少數推理步驟內合成深度圖。下面一起來閱讀一下這項工作~1.論文信息標題:DepthFM:FastMonocularDepthEstimationwithFlowMatching作者:MingGui,JohannesS.Fischer,UlrichPrestel,PingchuanMa,Dmytr

你好,電動Atlas!波士頓動力機器人復活,180度詭異動作嚇壞馬斯克 你好,電動Atlas!波士頓動力機器人復活,180度詭異動作嚇壞馬斯克 Apr 18, 2024 pm 07:58 PM

波士頓動力Atlas,正式進入電動機器人時代!昨天,液壓Atlas剛剛「含淚」退出歷史舞臺,今天波士頓動力就宣布:電動Atlas上崗??磥?,在商用人形機器人領域,波士頓動力是下定決心要和特斯拉硬剛一把了。新視頻放出后,短短十幾小時內,就已經有一百多萬觀看。舊人離去,新角色登場,這是歷史的必然。毫無疑問,今年是人形機器人的爆發(fā)年。網友銳評:機器人的進步,讓今年看起來像人類的開幕式動作、自由度遠超人類,但這真不是恐怖片?視頻一開始,Atlas平靜地躺在地上,看起來應該是仰面朝天。接下來,讓人驚掉下巴

iPhone上的蜂窩數據互聯網速度慢:修復 iPhone上的蜂窩數據互聯網速度慢:修復 May 03, 2024 pm 09:01 PM

在iPhone上面臨滯后,緩慢的移動數據連接?通常,手機上蜂窩互聯網的強度取決于幾個因素,例如區(qū)域、蜂窩網絡類型、漫游類型等。您可以采取一些措施來獲得更快、更可靠的蜂窩互聯網連接。修復1–強制重啟iPhone有時,強制重啟設備只會重置許多內容,包括蜂窩網絡連接。步驟1–只需按一次音量調高鍵并松開即可。接下來,按降低音量鍵并再次釋放它。步驟2–該過程的下一部分是按住右側的按鈕。讓iPhone完成重啟。啟用蜂窩數據并檢查網絡速度。再次檢查修復2–更改數據模式雖然5G提供了更好的網絡速度,但在信號較弱

谷歌狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇 谷歌狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇 Apr 01, 2024 pm 07:46 PM

谷歌力推的JAX在最近的基準測試中性能已經超過Pytorch和TensorFlow,7項指標排名第一。而且測試并不是在JAX性能表現最好的TPU上完成的。雖然現在在開發(fā)者中,Pytorch依然比Tensorflow更受歡迎。但未來,也許有更多的大模型會基于JAX平臺進行訓練和運行。模型最近,Keras團隊為三個后端(TensorFlow、JAX、PyTorch)與原生PyTorch實現以及搭配TensorFlow的Keras2進行了基準測試。首先,他們?yōu)樯墒胶头巧墒饺斯ぶ悄苋蝿者x擇了一組主流

特斯拉機器人進廠打工,馬斯克:手的自由度今年將達到22個! 特斯拉機器人進廠打工,馬斯克:手的自由度今年將達到22個! May 06, 2024 pm 04:13 PM

特斯拉機器人Optimus最新視頻出爐,已經可以在廠子里打工了。正常速度下,它分揀電池(特斯拉的4680電池)是這樣的:官方還放出了20倍速下的樣子——在小小的“工位”上,揀啊揀啊揀:這次放出的視頻亮點之一在于Optimus在廠子里完成這項工作,是完全自主的,全程沒有人為的干預。并且在Optimus的視角之下,它還可以把放歪了的電池重新撿起來放置,主打一個自動糾錯:對于Optimus的手,英偉達科學家JimFan給出了高度的評價:Optimus的手是全球五指機器人里最靈巧的之一。它的手不僅有觸覺

美國空軍高調展示首個AI戰(zhàn)斗機!部長親自試駕全程未干預,10萬行代碼試飛21次 美國空軍高調展示首個AI戰(zhàn)斗機!部長親自試駕全程未干預,10萬行代碼試飛21次 May 07, 2024 pm 05:00 PM

最近,軍事圈被這個消息刷屏了:美軍的戰(zhàn)斗機,已經能由AI完成全自動空戰(zhàn)了。是的,就在最近,美軍的AI戰(zhàn)斗機首次公開,揭開了神秘面紗。這架戰(zhàn)斗機的全名是可變穩(wěn)定性飛行模擬器測試飛機(VISTA),由美空軍部長親自搭乘,模擬了一對一的空戰(zhàn)。5月2日,美國空軍部長FrankKendall在Edwards空軍基地駕駛X-62AVISTA升空注意,在一小時的飛行中,所有飛行動作都由AI自主完成!Kendall表示——在過去的幾十年中,我們一直在思考自主空對空作戰(zhàn)的無限潛力,但它始終顯得遙不可及。然而如今,

超級智能體生命力覺醒!可自我更新的AI來了,媽媽再也不用擔心數據瓶頸難題 超級智能體生命力覺醒!可自我更新的AI來了,媽媽再也不用擔心數據瓶頸難題 Apr 29, 2024 pm 06:55 PM

哭死啊,全球狂煉大模型,一互聯網的數據不夠用,根本不夠用。訓練模型搞得跟《饑餓游戲》似的,全球AI研究者,都在苦惱怎么才能喂飽這群數據大胃王。尤其在多模態(tài)任務中,這一問題尤為突出。一籌莫展之際,來自人大系的初創(chuàng)團隊,用自家的新模型,率先在國內把“模型生成數據自己喂自己”變成了現實。而且還是理解側和生成側雙管齊下,兩側都能生成高質量、多模態(tài)的新數據,對模型本身進行數據反哺。模型是啥?中關村論壇上剛剛露面的多模態(tài)大模型Awaker1.0。團隊是誰?智子引擎。由人大高瓴人工智能學院博士生高一釗創(chuàng)立,高

See all articles