把腿张开老子cao哭你动态图 ,成人欧美日韩一区二区三区,japanese@hd熟女

首頁(yè)

科技周邊

人工智能

使用DeepSeek R1構(gòu)建RQA系統(tǒng)并簡(jiǎn)化

Christopher Nolan

Mar 07, 2025 am 10:43 AM

> DeepSeek R1：通過(guò)基于檢索的問(wèn)題回答

的AI應(yīng)用開(kāi)創(chuàng)性的開(kāi)源推理模型

DeepSeek R1正在迅速獲得其在構(gòu)建AI應(yīng)用方面的效率和準(zhǔn)確性的吸引力。本文詳細(xì)介紹了使用DeepSeek R1，Langchain和簡(jiǎn)化的基于檢索的問(wèn)答（RQA）系統(tǒng)的構(gòu)建。我們將在實(shí)際推理任務(wù)中探索其功能，并在實(shí)際應(yīng)用中展示其功能。

鍵學(xué)習(xí)成果：

掌握由DeepSeek R1驅(qū)動(dòng)的RQA系統(tǒng)的增強(qiáng)的推理和解決問(wèn)題的能力。
學(xué)會(huì)將DeepSeek R1集成到基于檢索的問(wèn)題解答系統(tǒng)中。
>分析現(xiàn)實(shí)世界DeepSeek R1在編碼，數(shù)學(xué)和邏輯推理中的應(yīng)用。
（本文是數(shù)據(jù)科學(xué)博客馬拉松的一部分。）目錄的
表：

了解DeepSeek R1

> DeepSeek R1-Zero和R1培訓(xùn)

> DeepSeek R1的四個(gè)訓(xùn)練階段

> DeepSeek R1的關(guān)鍵功能

的本地部署
構(gòu)建RQA系統(tǒng)
>理解DeepSeek R1
在AI的動(dòng)態(tài)領(lǐng)域，開(kāi)源基礎(chǔ)模型正在改變企業(yè)AI的開(kāi)發(fā)。由中國(guó)人工智能公司DeepSeek開(kāi)發(fā)的DeepSeek R1是一種開(kāi)源推理模型，旨在在需要邏輯推理，數(shù)學(xué)解決問(wèn)題和實(shí)時(shí)決策的任務(wù)上表現(xiàn)出色。從一般推理到代碼生成的各種應(yīng)用程序，它的效率和性能延伸。>
>

>許多大型語(yǔ)言模型（LLMS）遵循三階段的培訓(xùn)過(guò)程（預(yù)訓(xùn)練，監(jiān)督微調(diào)和強(qiáng)化學(xué)習(xí)），但DeepSeek R1-Zero采用了另一種方法。它利用了預(yù)先訓(xùn)練的DeepSeek-V3基本模型（6710億參數(shù)）和跳過(guò)監(jiān)督的微調(diào)，直接利用稱(chēng)為組相對(duì)策略?xún)?yōu)化（GRPO）的大規(guī)模增強(qiáng)學(xué)習(xí)技術(shù)。

基于近端策略?xún)?yōu)化（PPO）的

> DeepSeek R1的四個(gè)訓(xùn)練階段

> DeepSeek R1建立在DeepSeek R1-Zero的基礎(chǔ)之上，并結(jié)合了四個(gè)關(guān)鍵培訓(xùn)階段：

冷啟動(dòng)：在DeepSeek R1-Zero數(shù)據(jù)的高質(zhì)量子集上進(jìn)行微調(diào)以增強(qiáng)可讀性。
推理強(qiáng)化學(xué)習(xí)：通過(guò)跨編碼，數(shù)學(xué)，科學(xué)和邏輯領(lǐng)域的大規(guī)模強(qiáng)化學(xué)習(xí)來(lái)增強(qiáng)推理技能。
拒絕采樣和監(jiān)督微調(diào)：生成多個(gè)樣本，僅通過(guò)拒絕采樣保留正確且可讀的樣本，然后再通過(guò)生成獎(jiǎng)勵(lì)模型進(jìn)行進(jìn)一步的微調(diào)。>
>多樣化的強(qiáng)化學(xué)習(xí)：利用基于規(guī)則的獎(jiǎng)勵(lì)來(lái)完成數(shù)學(xué)和語(yǔ)言模型反饋以與人類(lèi)偏好保持一致。

> deepSeek r1的密鑰特征

>促進(jìn)檢查，修改和集成到各種項(xiàng)目中。在GitHub和Azure AI Foundry等平臺(tái)上可用。

高性能：

可與各種基準(zhǔn)（數(shù)學(xué)，代碼生成，復(fù)雜推理）上的OpenAI的GPT-4媲專(zhuān)家（MOE）體系結(jié)構(gòu)的混合物

> ： 67.1億個(gè)參數(shù)模型僅激活每個(gè)正向參數(shù)370億個(gè)參數(shù)，優(yōu)化效率。

蒸餾型：提供較小，更可部署的型號(hào)（例如，DeepSeek-R1-Distill-Qwen-32b，Qwen-1.5b，7b，7b，14b）。>

DeepSeek r1

本地部署

>使用Ollama很簡(jiǎn)單：

>安裝Ollama。

在您的終端中運(yùn)行以下命令（可以選擇模型大?。?ancy>>

構(gòu)建使用DeepSeek R1

ollama run deepseek-r1   # Default 7B model
ollama run deepseek-r1:1.5b # Specific model

的RQA系統(tǒng) Building a RQA System with DeepSeek R1 and Streamlit 讓我們使用langchain和deepseek r1構(gòu)建一個(gè)RQA系統(tǒng)：

步驟1：導(dǎo)入庫(kù)>

（步驟2-10：構(gòu)建簡(jiǎn)易應(yīng)用程序的其余步驟，包括文件上傳，嵌入創(chuàng)建，矢量存儲(chǔ)生成，檢索器設(shè)置，LLM定義，提示模板創(chuàng)建，QA鏈創(chuàng)建，UI定義和UI實(shí)現(xiàn)，與原始響應(yīng)相同。請(qǐng)參閱原始響應(yīng)。

輸出示例：

（用示例查詢(xún)和響應(yīng)說(shuō)明了應(yīng)用程序的功能。）>

import streamlit as st
from langchain_community.document_loaders.csv_loader import CSVLoader
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import FAISS
from langchain_community.llms import Ollama
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain
from langchain.chains.combine_documents.stuff import create_stuff_documents_chain
from langchain.chains import RetrievalQA

結(jié)論

DeepSeek R1代表了AI推理模型的重大進(jìn)步。它的復(fù)雜技術(shù)和開(kāi)源可訪(fǎng)問(wèn)性的結(jié)合使其成為開(kāi)發(fā)人員的強(qiáng)大工具。 RQA系統(tǒng)示例展示了其實(shí)際應(yīng)用和未來(lái)創(chuàng)新的潛力。

鑰匙要點(diǎn)：