国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目錄
學習目標
解決剪貼模型限制:
>步驟2:設置OpenAI API鍵並導入庫
步驟4:從PDF
步驟5:保存提取的數(shù)據(jù)
步驟6:塊文本數(shù)據(jù)
>步驟7:加載名詞嵌入模型
步驟8:生成嵌入
>步驟9:將文本嵌入在qdrant
>步驟10:將圖像嵌入在qdrant
>步驟11:創(chuàng)建一個多模式獵犬
步驟12:用蘭鏈構建多模式抹布
查詢模型
首頁 科技週邊 人工智慧 用假嵌入增強破布系統(tǒng)

用假嵌入增強破布系統(tǒng)

Mar 03, 2025 pm 06:08 PM

>多模式檢索儀(RAG)系統(tǒng)正在通過整合多種數(shù)據(jù)類型(TEXT,圖像,音頻和視頻)來徹底改變AI,從而獲得更多細微差別和上下文感知的響應。 這超過了傳統(tǒng)的抹布,這僅關注文本。 一個關鍵的進步是通訊嵌入,為視覺和文本數(shù)據(jù)創(chuàng)建了一個統(tǒng)一的空間,從而實現(xiàn)了無縫的跨模式交互。 高級模型會生成高質量的嵌入,改善信息檢索並彌合不同內容形式之間的差距,最終豐富用戶體驗。

學習目標

  • 掌握了多模式抹布的基本原理及其優(yōu)勢比傳統(tǒng)抹布。
  • 了解嵌入統(tǒng)一文本和圖像嵌入空間中的作用。
  • 比較剪輯模型的somic視覺嵌入,分析性能基準。
  • >使用somic Vision和Text Embeddings在Python中實現(xiàn)多模式的RAG系統(tǒng)。
  • 學習從PDF中提取和處理多模式檢索的文本和視覺數(shù)據(jù)。

*本文是*** 數(shù)據(jù)科學blogathon的一部分。

目錄的

>

    什麼是多模式的抹布?
  • nive vision嵌入
  • >雜誌嵌入的性能基準
  • python實施多模式抹布,帶有通知嵌入
    • >步驟1:安裝必要的庫
    • >步驟2:設置OpenAI API鍵並導入庫
    • >
    • 步驟3:從PDF
    • 中提取圖像
    • 步驟4:從PDF
    • 提取文本
    • 步驟5:保存提取的文本和圖像
    • 步驟6:塊文本數(shù)據(jù)
    • >步驟7:加載名詞嵌入模型
    • 步驟8:生成嵌入
    • >步驟9:將文本嵌入在qdrant
    • 中存儲
    • >步驟10:將圖像嵌入在qdrant
    • >步驟11:創(chuàng)建一個多模式獵犬
    • 步驟12:用蘭鏈構建多模式抹布
  • 查詢模型
  • 結論
  • 常見問題
什麼是多模式的抹布?

>多模式抹布代表了一個顯著的AI進步,這是通過合併多種數(shù)據(jù)類型來基於傳統(tǒng)抹布的。與主要處理文本的傳統(tǒng)系統(tǒng)不同,多模式抹布處理並同時集成了多個數(shù)據(jù)表格。這導致了更全面的理解和背景感知的反應。

鍵多模式抹布組件:

  • >數(shù)據(jù)攝入:來自各種來源的數(shù)據(jù)是使用專用處理器攝入的,確保驗證,清潔和歸一化。
  • >
  • >向量表示:>使用神經網絡(例如,圖像的剪輯,文本的剪輯,bert for Text)來處理統(tǒng)一的矢量嵌入,保留語義關係。
  • > 使用索引技術(HNSW,F(xiàn)AISS),將> >向量數(shù)據(jù)庫存儲:
  • 嵌入嵌入在優(yōu)化的矢量數(shù)據(jù)庫(例如qdrant)中,以有效檢索。 查詢處理:
  • >傳入查詢被分析,轉換為與存儲數(shù)據(jù)相同的向量空間,並用於識別相關模態(tài)並生成用於搜索的嵌入。
  • nive vision嵌入

解決剪貼模型限制:

>

>剪輯以零拍功能出色時,其文本編碼在圖像檢索之外的任務中表現(xiàn)不佳(如MTEB基準測試所示)。 Nimic Embed Vision通過將其視覺編碼器與嵌入式文本潛在空間保持一致來解決這一點。

媒體嵌入視覺與提名嵌入文本一起訓練,凍結文本編碼器並在圖像文本對上訓練視覺編碼器。這樣可以確保最佳的結果和與名詞嵌入文本嵌入的向後兼容性。

>

>雜誌嵌入的性能基準Enhancing RAG Systems with Nomic Embeddings

剪輯模型雖然在零拍功能方面令人印象深刻,但在語義相似性(MTEB基準)等單峰任務中顯示出弱點。通用嵌入視覺通過將其視覺編碼器與名詞嵌入文本潛在空間保持一致,從而克服了這一點,從而在圖像,文本和多模式任務(Imagenet Zero-Shot,MTEB,MTEB,DataComp Benchmarks)中產生了強大的性能。

python實施多模式抹布,帶有通知嵌入

本教程構建了一個多模式抹布系統(tǒng),從包含文本和圖像的PDF檢索信息(使用帶有T4 GPU的Google Colab)。

>步驟1:安裝庫Enhancing RAG Systems with Nomic Embeddings

安裝必要的Python庫:OpenAI,QDRANT,Transformers,Torch,Pymupdf等

>步驟2:設置OpenAI API鍵並導入庫

>

>設置OpenAI API密鑰並導入所需的庫(Pymupdf,PIL,Langchain,OpenAI等)。 (為簡短而省略了代碼。)

步驟3:從PDF

中提取圖像

>使用pymupdf從PDF提取圖像,然後將其保存到目錄中。 (為簡短而省略了代碼。)

步驟4:從PDF

提取文本

>使用pymupdf從每個PDF頁面中提取文本。 (為簡短而省略了代碼。)

步驟5:保存提取的數(shù)據(jù)

>保存提取的圖像和文本。 (為簡短而省略了代碼。)

步驟6:塊文本數(shù)據(jù)

>使用Langchain'sRecursiveCharacterTextSplitter將提取的文本分為較小的塊。 (為簡短而省略了代碼。)

>步驟7:加載名詞嵌入模型

>使用擁抱面孔的變形金剛加載Nomic的文本和視覺嵌入模型。 (為簡短而省略了代碼。)

步驟8:生成嵌入

生成文本和圖像嵌入。 (為簡短而省略了代碼。)

>步驟9:將文本嵌入在qdrant

中存儲

>將文本嵌入在QDrant集合中。 (為簡短而省略了代碼。)

>步驟10:將圖像嵌入在qdrant

>將圖像嵌入在單獨的QDrant集合中。 (為簡短而省略了代碼。)

>步驟11:創(chuàng)建一個多模式獵犬

>創(chuàng)建一個函數(shù),以根據(jù)查詢檢索相關的文本和圖像嵌入。 (為簡短而省略了代碼。)

步驟12:用蘭鏈構建多模式抹布

>使用Langchain處理被檢索的數(shù)據(jù)並使用語言模型(例如GPT-4)生成響應。 (為簡短而省略了代碼。)

查詢模型

>示例查詢演示了系統(tǒng)從PDF中從文本和圖像中檢索信息的能力。 (示例查詢和輸出省略了,但在原始中存在。

結論

鑰匙要點

多模式抹布整合了多種數(shù)據(jù)類型,以更全面地理解。 nive vision嵌入統(tǒng)一視覺和文本數(shù)據(jù)以改進信息檢索。

該系統(tǒng)使用專門的處理,向量表示和存儲以進行有效檢索。
    nimic嵌入視力克服了剪輯在單峰任務中的局限性。
  • 常見問題
  • (為簡潔而省略了常見問題,但以原始形式存在。)
  • >

    注意:為簡短而省略了代碼片段,但核心功能和步驟仍然準確地描述了。 原始輸入包含廣泛的代碼;包括所有這些都會使這一響應過長。 請參閱原始輸入以進行完整的代碼實現(xiàn)。

    >

以上是用假嵌入增強破布系統(tǒng)的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發(fā)現(xiàn)涉嫌抄襲或侵權的內容,請聯(lián)絡admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

AI投資者停滯不前? 3條購買,建造或與人工智能供應商合作的戰(zhàn)略途徑 AI投資者停滯不前? 3條購買,建造或與人工智能供應商合作的戰(zhàn)略途徑 Jul 02, 2025 am 11:13 AM

投資蓬勃發(fā)展,但僅資本還不夠。隨著估值的上升和獨特性的衰落,以AI為中心的風險投資的投資者必須做出關鍵決定:購買,建立或合作夥伴才能獲得優(yōu)勢?這是評估每個選項和PR的方法

生成AI的不可阻擋的增長(AI Outlook第1部分) 生成AI的不可阻擋的增長(AI Outlook第1部分) Jun 21, 2025 am 11:11 AM

披露:我的公司Tirias Research已向IBM,NVIDIA和本文提到的其他公司諮詢。 Growth驅動力的生成AI採用的激增比最樂觀的預測更具戲劇性。然後,

AGI和AI超級智能將嚴重擊中人類天花板的假設障礙 AGI和AI超級智能將嚴重擊中人類天花板的假設障礙 Jul 04, 2025 am 11:10 AM

讓我們來談談。 對創(chuàng)新AI突破的分析是我正在進行的AI中正在進行的福布斯列覆蓋的一部分,包括識別和解釋各種有影響力的AI複雜性(請參閱此處的鏈接)。 前往Agi和

構建您的第一個LLM應用程序:初學者的教程 構建您的第一個LLM應用程序:初學者的教程 Jun 24, 2025 am 10:13 AM

您是否曾經嘗試過建立自己的大型語言模型(LLM)應用程序?有沒有想過人們如何提高自己的LLM申請來提高生產率? LLM應用程序已被證明在各個方面都有用

AMD繼續(xù)在AI中建立動力,還有很多工作要做 AMD繼續(xù)在AI中建立動力,還有很多工作要做 Jun 28, 2025 am 11:15 AM

總體而言,我認為該活動對於展示AMD如何向客戶和開發(fā)人員移動球非常重要。在SU下,AMD的M.O.要製定明確,雄心勃勃的計劃並對他們執(zhí)行。她的“說/do”比率很高。公司做

Kimi K2:最強大的開源代理模型 Kimi K2:最強大的開源代理模型 Jul 12, 2025 am 09:16 AM

還記得今年早些時候破壞了Genai行業(yè)的大量開源中國模型嗎?儘管DeepSeek佔據(jù)了大多數(shù)頭條新聞,但Kimi K1.5是列表中的重要名字之一。模型很酷。

未來預測從AI到AGI的道路上的大規(guī)模情報爆炸 未來預測從AI到AGI的道路上的大規(guī)模情報爆炸 Jul 02, 2025 am 11:19 AM

讓我們來談談。 對創(chuàng)新AI突破的分析是我正在進行的AI中正在進行的福布斯列覆蓋的一部分,包括識別和解釋各種有影響力的AI複雜性(請參閱此處的鏈接)。對於那些讀者

Geoffrey Hinton的7個關鍵亮點 Geoffrey Hinton的7個關鍵亮點 Jun 21, 2025 am 10:54 AM

如果AI的教父告訴您“訓練成為水管工”,那麼您知道這是值得聽的 - 至少這就是引起我注意的原因。在最近的討論中,杰弗裡·欣頓(Geoffrey Hinton)談到了超級智能AI所塑造的潛在未來,如果您

See all articles