国产97人人超碰caoprom,搞av.com,古典武侠,人妻,狠狠,久久

Table des matières

Qu'est-ce que l'intégration??

Pourquoi choisir PostgreSQL et pgvector??

Présentation de l'application

Prérequis

Conclusion

Maison

développement back-end

Golang

Créer un moteur de recherche sémantique avec OpenAI, Go et PostgreSQL (pgvector)

Linda Hamilton

Jan 15, 2025 am 11:09 AM

Building a Semantic Search Engine with OpenAI, Go, and PostgreSQL (pgvector)

Ces dernières années, les intégrations vectorielles sont devenues le fondement du traitement du langage naturel (NLP) moderne et de la recherche sémantique. Au lieu de s'appuyer sur des recherches par mots clés, les bases de données vectorielles comparent la ? signification ? du texte à l'aide de représentations numériques (embeddings). Cet exemple montre comment créer un moteur de recherche sémantique à l'aide de l'intégration OpenAI, Go et PostgreSQL avec l'extension pgvector.

Qu'est-ce que l'intégration??

L'intégration est une représentation vectorielle de texte (ou d'autres données) dans un espace de grande dimension. Si deux morceaux de texte sont sémantiquement similaires, leurs vecteurs seront proches l’un de l’autre dans cet espace. En stockant les intégrations dans une base de données comme PostgreSQL (avec l'extension pgvector), nous pouvons effectuer des recherches de similarité rapidement et avec précision.

Pourquoi choisir PostgreSQL et pgvector??

pgvector est une extension populaire qui ajoute des types de données vectorielles à PostgreSQL. Il vous permet de :

Stocker les intégrations sous forme de colonnes vectorielles
Effectuer une recherche approximative ou exacte du voisin le plus proche
Exécuter des requêtes en utilisant SQL standard

Présentation de l'application

Appelez l'API d'intégration d'OpenAI pour convertir le texte d'entrée en intégrations vectorielles.
Utilisez l'extension pgvector pour stocker ces intégrations dans PostgreSQL.
Interrogez les intégrations pour trouver les entrées les plus sémantiquement similaires dans la base de données.

Prérequis

Go installé (1.19 recommandé).
PostgreSQL installé et exécuté (local ou hébergé).
Installez l'extension pgvector dans PostgreSQL. (Voir la page GitHub de pgvector pour les instructions d'installation.)
Clé API OpenAI avec accès intégré.

Makefile contenant les taches liées à postgres/pgvector et Docker pour les tests locaux.

pgvector:
    @docker run -d \
        --name pgvector \
        -e POSTGRES_USER=admin \
        -e POSTGRES_PASSWORD=admin \
        -e POSTGRES_DB=vectordb \
        -v pgvector_data:/var/lib/postgresql/data \
        -p 5432:5432 \
        pgvector/pgvector:pg17
psql:
    @psql -h localhost -U admin -d vectordb

Assurez-vous que pgvector est installé. Ensuite, dans votre base de données PostgreSQL?:

CREATE EXTENSION IF NOT EXISTS vector;

Code complet

package main

import (
    "context"
    "fmt"
    "log"
    "os"
    "strings"

    "github.com/jackc/pgx/v5/pgxpool"
    "github.com/joho/godotenv"
    "github.com/sashabaranov/go-openai"
)

func floats32ToString(floats []float32) string {
    strVals := make([]string, len(floats))
    for i, val := range floats {
        // 將每個浮點數(shù)格式化為字符串
        strVals[i] = fmt.Sprintf("%f", val)
    }

    // 使用逗號 + 空格連接它們
    joined := strings.Join(strVals, ", ")

    // pgvector 需要方括號表示法才能輸入向量，例如 [0.1, 0.2, 0.3]
    return "[" + joined + "]"
}

func main() {
    // 加載環(huán)境變量
    err := godotenv.Load()
    if err != nil {
        log.Fatal("加載 .env 文件出錯")
    }

    // 創(chuàng)建連接池
    dbpool, err := pgxpool.New(context.Background(), os.Getenv("DATABASE_URL"))
    if err != nil {
        fmt.Fprintf(os.Stderr, "無法創(chuàng)建連接池：%v\n", err)
        os.Exit(1)
    }
    defer dbpool.Close()

    // 1. 確保已啟用 pgvector 擴展
    _, err = dbpool.Exec(context.Background(), "CREATE EXTENSION IF NOT EXISTS vector;")
    if err != nil {
        log.Fatalf("創(chuàng)建擴展失敗：%v\n", err)
        os.Exit(1)
    }

    // 2. 創(chuàng)建表（如果不存在）
    createTableSQL := `
    CREATE TABLE IF NOT EXISTS documents (
        id SERIAL PRIMARY KEY,
        content TEXT,
        embedding vector(1536)
    );
    `
    _, err = dbpool.Exec(context.Background(), createTableSQL)
    if err != nil {
        log.Fatalf("創(chuàng)建表失?。?v\n", err)
    }

    // 3. 創(chuàng)建索引（如果不存在）
    createIndexSQL := `
    CREATE INDEX IF NOT EXISTS documents_embedding_idx
    ON documents USING ivfflat (embedding vector_l2_ops) WITH (lists = 100);
    `
    _, err = dbpool.Exec(context.Background(), createIndexSQL)
    if err != nil {
        log.Fatalf("創(chuàng)建索引失敗：%v\n", err)
    }

    // 4. 初始化 OpenAI 客戶端
    apiKey := os.Getenv("OPENAI_API_KEY")
    if apiKey == "" {
        log.Fatal("未設(shè)置 OPENAI_API_KEY")
    }
    openaiClient := openai.NewClient(apiKey)

    // 5. 插入示例文檔
    docs := []string{
        "PostgreSQL 是一個先進的開源關(guān)系數(shù)據(jù)庫。",
        "OpenAI 提供基于 GPT 的模型來生成文本嵌入。",
        "pgvector 允許將嵌入存儲在 Postgres 數(shù)據(jù)庫中。",
    }

    for _, doc := range docs {
        err = insertDocument(context.Background(), dbpool, openaiClient, doc)
        if err != nil {
            log.Printf("插入文檔“%s”失敗：%v\n", doc, err)
        }
    }

    // 6. 查詢相似性
    queryText := "如何在 Postgres 中存儲嵌入？"
    similarDocs, err := searchSimilarDocuments(context.Background(), dbpool, openaiClient, queryText, 5)
    if err != nil {
        log.Fatalf("搜索失敗：%v\n", err)
    }

    fmt.Println("=== 最相似的文檔 ===")
    for _, doc := range similarDocs {
        fmt.Printf("- %s\n", doc)
    }
}

// insertDocument 使用 OpenAI API 為 `content` 生成嵌入，并將其插入 documents 表中。
func insertDocument(ctx context.Context, dbpool *pgxpool.Pool, client *openai.Client, content string) error {
    // 1) 從 OpenAI 獲取嵌入
    embedResp, err := client.CreateEmbeddings(ctx, openai.EmbeddingRequest{
        Model: openai.AdaEmbeddingV2, // "text-embedding-ada-002"
        Input: []string{content},
    })
    if err != nil {
        return fmt.Errorf("CreateEmbeddings API 調(diào)用失?。?w", err)
    }

    // 2) 將嵌入轉(zhuǎn)換為 pgvector 的方括號字符串
    embedding := embedResp.Data[0].Embedding // []float32
    embeddingStr := floats32ToString(embedding)

    // 3) 插入 PostgreSQL
    insertSQL := `
        INSERT INTO documents (content, embedding)
        VALUES (, ::vector)
    `
    _, err = dbpool.Exec(ctx, insertSQL, content, embeddingStr)
    if err != nil {
        return fmt.Errorf("插入文檔失敗：%w", err)
    }

    return nil
}

// searchSimilarDocuments 獲取用戶查詢的嵌入，并根據(jù)向量相似性返回前 k 個相似的文檔。
func searchSimilarDocuments(ctx context.Context, pool *pgxpool.Pool, client *openai.Client, query string, k int) ([]string, error) {
    // 1) 通過 OpenAI 獲取用戶查詢的嵌入
    embedResp, err := client.CreateEmbeddings(ctx, openai.EmbeddingRequest{
        Model: openai.AdaEmbeddingV2, // "text-embedding-ada-002"
        Input: []string{query},
    })
    if err != nil {
        return nil, fmt.Errorf("CreateEmbeddings API 調(diào)用失?。?w", err)
    }

    // 2) 將 OpenAI 嵌入轉(zhuǎn)換為 pgvector 的方括號字符串格式
    queryEmbedding := embedResp.Data[0].Embedding // []float32
    queryEmbeddingStr := floats32ToString(queryEmbedding)
    // 例如 "[0.123456, 0.789012, ...]"

    // 3) 構(gòu)建按向量相似性排序的 SELECT 語句
    selectSQL := fmt.Sprintf(`
        SELECT content
        FROM documents
        ORDER BY embedding <-> '%s'::vector
        LIMIT %d;
    `, queryEmbeddingStr, k)

    // 4) 運行查詢
    rows, err := pool.Query(ctx, selectSQL)
    if err != nil {
        return nil, fmt.Errorf("查詢文檔失?。?w", err)
    }
    defer rows.Close()

    // 5) 讀取匹配的文檔
    var contents []string
    for rows.Next() {
        var content string
        if err := rows.Scan(&content); err != nil {
            return nil, fmt.Errorf("掃描行失?。?w", err)
        }
        contents = append(contents, content)
    }
    if err = rows.Err(); err != nil {
        return nil, fmt.Errorf("行迭代錯誤：%w", err)
    }

    return contents, nil
}

Conclusion

Les intégrations OpenAI dans PostgreSQL, Go et pgvector fournissent une solution simple pour créer des applications de recherche sémantique. En représentant le texte sous forme de vecteurs et en tirant parti de la puissance des index de bases de données, nous passons des recherches traditionnelles basées sur des mots clés à la recherche par contexte et par signification.

Cette sortie révisée conserve le style de langue d'origine, reformule les phrases pour plus d'originalité et conserve l'image dans le même format et le même emplacement. Le code est également légèrement amélioré pour plus de clarté et de lisibilité. Les principales modifications incluent des noms de variables et des commentaires plus descriptifs.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefa?on, veuillez contacter admin@php.cn

Outils d'IA chauds

Undress AI Tool

Images de déshabillage gratuites

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

échangez les visages dans n'importe quelle vidéo sans effort grace à notre outil d'échange de visage AI entièrement gratuit?!

Afficher plus

Article chaud

Guide de construction de Grass Wonder | Uma musume joli derby

1 Il y a quelques mois By Jack chen

<??>: 99 nuits dans la forêt - tous les badges et comment les déverrouiller

4 Il y a quelques semaines By DDD

Uma Musume Pretty Derby Banner Schedule (juillet 2025)

1 Il y a quelques mois By Jack chen

Guide de température de Rimworld Odyssey pour les navires et Gravtech

3 Il y a quelques semaines By Jack chen

Windows Security est vide ou ne montre pas les options

1 Il y a quelques mois By 下次還敢

Afficher plus

Outils chauds

Bloc-notes++7.3.1

éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Tutoriel Laravel

1601

Tutoriel PHP

1502

276

Afficher plus

Related knowledge

Est le frontend ou le backend de Golang Jul 08, 2025 am 01:44 AM

Golang est principalement utilisé pour le développement back-end, mais il peut également jouer un r?le indirect dans le champ frontal. Ses objectifs de conception se concentrent sur les hautes performances, le traitement simultané et la programmation au niveau du système, et conviennent à la création d'applications arrière telles que les serveurs API, les microservices, les systèmes distribués, les opérations de base de données et les outils CLI. Bien que Golang ne soit pas le langage grand public de la file d'attente Web, il peut être compilé en JavaScript via GOPHERJS, exécuter sur WebAssembly via Tinygo, ou générer des pages HTML avec un moteur de modèle pour participer au développement frontal. Cependant, le développement frontal moderne doit encore s'appuyer sur JavaScript / TypeScript et son écosystème. Par conséquent, Golang convient plus à la sélection de la pile technologique avec un backend haute performance comme noyau.

Comment installer Go Jul 09, 2025 am 02:37 AM

La clé de l'installation de Go est de sélectionner la version correcte, de configurer les variables d'environnement et de vérifier l'installation. 1. Accédez au site officiel pour télécharger le package d'installation du système correspondant. Windows utilise des fichiers .msi, macOS utilise des fichiers .pkg, Linux utilise des fichiers .tar.gz et les décompressez vers / usr / répertoire local; 2. Configurer les variables d'environnement, modifier ~ / .Bashrc ou ~ / .zshrc dans Linux / macOS pour ajouter le chemin et Gopath, et Windows définit le chemin d'accès pour aller dans les propriétés du système; 3. Utilisez la commande gouvernementale pour vérifier l'installation et exécutez le programme de test Hello.go pour confirmer que la compilation et l'exécution sont normales. Paramètres et boucles de chemin tout au long du processus

Comment construire une API GraphQL à Golang Jul 08, 2025 am 01:03 AM

Pour construire un GraphQlapi en Go, il est recommandé d'utiliser la bibliothèque GQLGEN pour améliorer l'efficacité du développement. 1. Sélectionnez d'abord la bibliothèque appropriée, telle que GQLGEN, qui prend en charge la génération automatique de code basée sur le schéma; 2. Définissez ensuite GraphQlschema, décrivez la structure de l'API et le portail de requête, tels que la définition des types de post et des méthodes de requête; 3. Puis initialisez le projet et générez du code de base pour implémenter la logique métier dans Resolver; 4. Enfin, connectez GraphQlHandler à HttpServer et testez l'API via le terrain de jeu intégré. Les notes incluent les spécifications de dénomination des champs, la gestion des erreurs, l'optimisation des performances et les paramètres de sécurité pour assurer la maintenance du projet

GO sync.WaitGroup Exemple Jul 09, 2025 am 01:48 AM

Sync.WaitGroup est utilisé pour attendre qu'un groupe de Goroutines termine la tache. Son noyau est de travailler ensemble sur trois méthodes: ajouter, faire et attendre. 1.Add (n) Définissez le nombre de Goroutines à attendre; 2.Done () est appelé à la fin de chaque goroutine, et le nombre est réduit de un; 3.Wait () bloque la coroutine principale jusqu'à ce que toutes les taches soient effectuées. Lorsque vous l'utilisez, veuillez noter: ADD doit être appelé à l'extérieur du goroutine, évitez l'attente en double et assurez-vous de vous assurer que Don est appelé. Il est recommandé de l'utiliser avec un report. Il est courant dans la rampe simultanée des pages Web, du traitement des données par lots et d'autres scénarios, et peut contr?ler efficacement le processus de concurrence.

Tutoriel de package d'intégration Jul 09, 2025 am 02:46 AM

L'utilisation du package Embed de Go peut facilement intégrer des ressources statiques dans le binaire, adapté aux services Web pour emballer HTML, CSS, images et autres fichiers. 1. Déclarez la ressource intégrée à ajouter // Go: Embed Commentaire avant la variable, telle que l'intégration d'un seul fichier hello.txt; 2. Il peut être intégré dans l'ensemble du répertoire tel que statique / *, et réaliser des emballages multi-fichiers via ENGED.fs; 3. Il est recommandé de changer le mode de chargement du disque via des variables BuildTag ou Environment pour améliorer l'efficacité; 4. Faites attention à la précision du chemin, aux limitations de la taille des fichiers et aux caractéristiques en lecture seule des ressources intégrées. L'utilisation rationnelle de l'intégration peut simplifier le déploiement et optimiser la structure du projet.

Opter pour un traitement audio / vidéo Jul 20, 2025 am 04:14 AM

Le c?ur du traitement audio et vidéo consiste à comprendre le processus de base et les méthodes d'optimisation. 1. Le processus de base comprend l'acquisition, le codage, la transmission, le décodage et la lecture, et chaque lien a des difficultés techniques; 2. Des problèmes courants tels que l'audio et l'aberration vidéo, le retard de latence, le bruit sonore, l'image floue, etc. peuvent être résolues par ajustement synchrone, optimisation de codage, module de réduction du bruit, ajustement des paramètres, etc.; 3. Il est recommandé d'utiliser FFMPEG, OpenCV, WebBrTC, GStreamer et d'autres outils pour atteindre des fonctions; 4. En termes de gestion des performances, nous devons prêter attention à l'accélération matérielle, à la définition raisonnable des fréquences d'images de résolution, à des problèmes de concurrence et de fuite de mémoire de contr?le. La ma?trise de ces points clés contribuera à améliorer l'efficacité du développement et l'expérience utilisateur.

Comment créer un serveur Web dans Go Jul 15, 2025 am 03:05 AM

Il n'est pas difficile de créer un serveur Web écrit en Go. Le noyau réside dans l'utilisation du package net / http pour implémenter des services de base. 1. Utilisez Net / HTTP pour démarrer le serveur le plus simple: enregistrez les fonctions de traitement et écoutez les ports via quelques lignes de code; 2. Gestion du routage: utilisez Servmux pour organiser plusieurs chemins d'interface pour une gestion structurée facile; 3. Pratiques communes: routage de groupe par modules fonctionnels et utiliser des bibliothèques tierces pour prendre en charge l'appariement complexe; 4. Service de fichiers statique: Fournissez des fichiers HTML, CSS et JS via HTTP.FileServer; 5. Performances et sécurité: activer HTTPS, limiter la taille du corps de la demande et définir le délai d'attente pour améliorer la sécurité et les performances. Après avoir ma?trisé ces points clés, il sera plus facile d'élargir les fonctionnalités.

Allez sélectionner avec le cas par défaut Jul 14, 2025 am 02:54 AM

Le but de Select Plus Default est de permettre à Select d'effectuer un comportement par défaut lorsqu'aucune autre branche n'est prête à éviter le blocage du programme. 1. Lorsque vous recevez des données du canal sans blocage, si le canal est vide, il entrera directement la branche par défaut; 2. En combinaison avec le temps. Après ou Ticker, essayez d'envoyer des données régulièrement. Si le canal est plein, il ne bloque pas et ne sautera pas; 3. Empêcher les blocs de bloces, éviter le programme coincé lorsqu'il est incertain si le canal est fermé; Lorsque vous l'utilisez, veuillez noter que la branche par défaut sera exécutée immédiatement et ne peut pas être abusée, et que par défaut et le cas s'excluent mutuellement et ne seront pas exécutés en même temps.

See all articles

国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

Créer un moteur de recherche sémantique avec OpenAI, Go et PostgreSQL (pgvector)

Qu'est-ce que l'intégration??

Pourquoi choisir PostgreSQL et pgvector??

Présentation de l'application

Prérequis

Conclusion

Outils d'IA chauds

Undress AI Tool

Undresser.AI Undress

AI Clothes Remover

Clothoff.io

Video Face Swap

Article chaud

Outils chauds

Bloc-notes++7.3.1

SublimeText3 version chinoise

Envoyer Studio 13.0.1

Dreamweaver CS6

SublimeText3 version Mac

Sujets chauds