近年、ベクトル埋め込みは現(xiàn)代の自然言語処理 (NLP) とセマンティック検索の基礎(chǔ)となっています。ベクトル データベースは、キーワード検索に依存するのではなく、數(shù)値表現(xiàn) (埋め込み) を通じてテキストの「意味」を比較します。この例では、OpenAI 埋め込み、Go、および pgvector 拡張機(jī)能を備えた PostgreSQL を使用してセマンティック検索エンジンを作成する方法を示します。
埋め込みとは何ですか?
埋め込みは、高次元空間におけるテキスト (またはその他のデータ) のベクトル表現(xiàn)です。 2 つのテキストが意味的に類似している場(chǎng)合、それらのベクトルはこの空間內(nèi)で互いに近くなります。 PostgreSQL (pgvector 拡張子付き) のようなデータベースに埋め込みを保存することで、類似性検索を迅速かつ正確に実行できます。
なぜ PostgreSQL と pgvector を選ぶのですか?
pgvector は、PostgreSQL にベクトル データ型を追加する一般的な拡張機(jī)能です。これにより次のことが可能になります:
- エンベディングをベクトル列として保存します
- 近似または正確な最近傍検索を?qū)g行します
- 標(biāo)準(zhǔn) SQL を使用してクエリを?qū)g行します
アプリの概要
- OpenAI の埋め込み API を呼び出して、入力テキストをベクトル埋め込みに変換します。
- これらの埋め込みを PostgreSQL に保存するには、pgvector 拡張機(jī)能を使用します。
- 埋め込みをクエリして、データベース內(nèi)で意味的に最も類似したエントリを検索します。
前提條件
- インストールしてください (1.19 を推奨)。
- PostgreSQL がインストールされ、実行されています (ローカルまたはホスト)。
- PostgreSQL に pgvector 拡張機(jī)能をインストールします。 (インストール手順については、pgvector の GitHub ページを參照してください。)
- アクセスが埋め込まれた OpenAI API キー。
ローカル テスト用の postgres/pgvector および Docker に関連するタスクを含む Makefile。
pgvector: @docker run -d \ --name pgvector \ -e POSTGRES_USER=admin \ -e POSTGRES_PASSWORD=admin \ -e POSTGRES_DB=vectordb \ -v pgvector_data:/var/lib/postgresql/data \ -p 5432:5432 \ pgvector/pgvector:pg17 psql: @psql -h localhost -U admin -d vectordb
pgvector がインストールされていることを確認(rèn)してください。次に、PostgreSQL データベースで次のようにします:
CREATE EXTENSION IF NOT EXISTS vector;
完全なコード
package main import ( "context" "fmt" "log" "os" "strings" "github.com/jackc/pgx/v5/pgxpool" "github.com/joho/godotenv" "github.com/sashabaranov/go-openai" ) func floats32ToString(floats []float32) string { strVals := make([]string, len(floats)) for i, val := range floats { // 將每個(gè)浮點(diǎn)數(shù)格式化為字符串 strVals[i] = fmt.Sprintf("%f", val) } // 使用逗號(hào) + 空格連接它們 joined := strings.Join(strVals, ", ") // pgvector 需要方括號(hào)表示法才能輸入向量,例如 [0.1, 0.2, 0.3] return "[" + joined + "]" } func main() { // 加載環(huán)境變量 err := godotenv.Load() if err != nil { log.Fatal("加載 .env 文件出錯(cuò)") } // 創(chuàng)建連接池 dbpool, err := pgxpool.New(context.Background(), os.Getenv("DATABASE_URL")) if err != nil { fmt.Fprintf(os.Stderr, "無法創(chuàng)建連接池:%v\n", err) os.Exit(1) } defer dbpool.Close() // 1. 確保已啟用 pgvector 擴(kuò)展 _, err = dbpool.Exec(context.Background(), "CREATE EXTENSION IF NOT EXISTS vector;") if err != nil { log.Fatalf("創(chuàng)建擴(kuò)展失敗:%v\n", err) os.Exit(1) } // 2. 創(chuàng)建表(如果不存在) createTableSQL := ` CREATE TABLE IF NOT EXISTS documents ( id SERIAL PRIMARY KEY, content TEXT, embedding vector(1536) ); ` _, err = dbpool.Exec(context.Background(), createTableSQL) if err != nil { log.Fatalf("創(chuàng)建表失?。?v\n", err) } // 3. 創(chuàng)建索引(如果不存在) createIndexSQL := ` CREATE INDEX IF NOT EXISTS documents_embedding_idx ON documents USING ivfflat (embedding vector_l2_ops) WITH (lists = 100); ` _, err = dbpool.Exec(context.Background(), createIndexSQL) if err != nil { log.Fatalf("創(chuàng)建索引失?。?v\n", err) } // 4. 初始化 OpenAI 客戶端 apiKey := os.Getenv("OPENAI_API_KEY") if apiKey == "" { log.Fatal("未設(shè)置 OPENAI_API_KEY") } openaiClient := openai.NewClient(apiKey) // 5. 插入示例文檔 docs := []string{ "PostgreSQL 是一個(gè)先進(jìn)的開源關(guān)系數(shù)據(jù)庫(kù)。", "OpenAI 提供基于 GPT 的模型來生成文本嵌入。", "pgvector 允許將嵌入存儲(chǔ)在 Postgres 數(shù)據(jù)庫(kù)中。", } for _, doc := range docs { err = insertDocument(context.Background(), dbpool, openaiClient, doc) if err != nil { log.Printf("插入文檔“%s”失?。?v\n", doc, err) } } // 6. 查詢相似性 queryText := "如何在 Postgres 中存儲(chǔ)嵌入?" similarDocs, err := searchSimilarDocuments(context.Background(), dbpool, openaiClient, queryText, 5) if err != nil { log.Fatalf("搜索失敗:%v\n", err) } fmt.Println("=== 最相似的文檔 ===") for _, doc := range similarDocs { fmt.Printf("- %s\n", doc) } } // insertDocument 使用 OpenAI API 為 `content` 生成嵌入,并將其插入 documents 表中。 func insertDocument(ctx context.Context, dbpool *pgxpool.Pool, client *openai.Client, content string) error { // 1) 從 OpenAI 獲取嵌入 embedResp, err := client.CreateEmbeddings(ctx, openai.EmbeddingRequest{ Model: openai.AdaEmbeddingV2, // "text-embedding-ada-002" Input: []string{content}, }) if err != nil { return fmt.Errorf("CreateEmbeddings API 調(diào)用失?。?w", err) } // 2) 將嵌入轉(zhuǎn)換為 pgvector 的方括號(hào)字符串 embedding := embedResp.Data[0].Embedding // []float32 embeddingStr := floats32ToString(embedding) // 3) 插入 PostgreSQL insertSQL := ` INSERT INTO documents (content, embedding) VALUES (, ::vector) ` _, err = dbpool.Exec(ctx, insertSQL, content, embeddingStr) if err != nil { return fmt.Errorf("插入文檔失?。?w", err) } return nil } // searchSimilarDocuments 獲取用戶查詢的嵌入,并根據(jù)向量相似性返回前 k 個(gè)相似的文檔。 func searchSimilarDocuments(ctx context.Context, pool *pgxpool.Pool, client *openai.Client, query string, k int) ([]string, error) { // 1) 通過 OpenAI 獲取用戶查詢的嵌入 embedResp, err := client.CreateEmbeddings(ctx, openai.EmbeddingRequest{ Model: openai.AdaEmbeddingV2, // "text-embedding-ada-002" Input: []string{query}, }) if err != nil { return nil, fmt.Errorf("CreateEmbeddings API 調(diào)用失?。?w", err) } // 2) 將 OpenAI 嵌入轉(zhuǎn)換為 pgvector 的方括號(hào)字符串格式 queryEmbedding := embedResp.Data[0].Embedding // []float32 queryEmbeddingStr := floats32ToString(queryEmbedding) // 例如 "[0.123456, 0.789012, ...]" // 3) 構(gòu)建按向量相似性排序的 SELECT 語句 selectSQL := fmt.Sprintf(` SELECT content FROM documents ORDER BY embedding <-> '%s'::vector LIMIT %d; `, queryEmbeddingStr, k) // 4) 運(yùn)行查詢 rows, err := pool.Query(ctx, selectSQL) if err != nil { return nil, fmt.Errorf("查詢文檔失?。?w", err) } defer rows.Close() // 5) 讀取匹配的文檔 var contents []string for rows.Next() { var content string if err := rows.Scan(&content); err != nil { return nil, fmt.Errorf("掃描行失?。?w", err) } contents = append(contents, content) } if err = rows.Err(); err != nil { return nil, fmt.Errorf("行迭代錯(cuò)誤:%w", err) } return contents, nil }
結(jié)論
PostgreSQL、Go、pgvector の OpenAI 埋め込みは、セマンティック検索アプリケーションを構(gòu)築するための簡(jiǎn)単なソリューションを提供します。テキストをベクトルとして表現(xiàn)し、データベース インデックスの力を活用することで、従來のキーワードベースの検索からコンテキストと意味による検索に移行します。
この改訂された出力では、元の言語スタイルが維持され、オリジナリティーを高めるために文が言い換えられ、畫像の形式と位置が維持されます。また、主な変更點(diǎn)には、より説明的な変數(shù)名とコメントが含まれています。
以上がOpenAI、Go、PostgreSQL を使用したセマンティック検索エンジンの構(gòu)築 (pgvector)の詳細(xì)內(nèi)容です。詳細(xì)については、PHP 中國(guó)語 Web サイトの他の関連記事を參照してください。

ホットAIツール

Undress AI Tool
脫衣畫像を無料で

Undresser.AI Undress
リアルなヌード寫真を作成する AI 搭載アプリ

AI Clothes Remover
寫真から衣服を削除するオンライン AI ツール。

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡(jiǎn)単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中國(guó)語版
中國(guó)語版、とても使いやすい

ゼンドスタジオ 13.0.1
強(qiáng)力な PHP 統(tǒng)合開発環(huán)境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

Golangは主にバックエンド開発に使用されますが、フロントエンドフィールドで間接的な役割を果たすこともできます。その設(shè)計(jì)目標(biāo)は、高性能、同時(shí)処理、システムレベルのプログラミングに焦點(diǎn)を當(dāng)てており、APIサーバー、マイクロサービス、分散システム、データベース操作、CLIツールなどのバックエンドアプリケーションの構(gòu)築に適しています。 GolangはWebフロントエンドの主流言語ではありませんが、Gopherjsを介してJavaScriptにコンパイルしたり、Tinygoを介してWebAssemblyで実行したり、テンプレートエンジンを備えたHTMLページを生成してフロントエンド開発に參加できます。ただし、最新のフロントエンド開発は、JavaScript/TypeScriptとそのエコシステムに依存する必要があります。したがって、Golangは、コアとして高性能バックエンドを備えたテクノロジースタック選択により適しています。

GOでGraphQlapiを構(gòu)築するには、GQLGenライブラリを使用して開発効率を向上させることをお?jiǎng)幛幛筏蓼埂?1.最初に、スキーマに基づいた自動(dòng)コード生成をサポートするGQLGENなどの適切なライブラリを選択します。 2。次に、graphqlschemaを定義し、投稿の種類やクエリメソッドの定義など、API構(gòu)造とクエリポータルを説明します。 3。次に、プロジェクトを初期化し、基本コードを生成して、リゾルバにビジネスロジックを?qū)g裝します。 4.最後に、graphqlhandlerをhttpserverに接続し、組み込みの遊び場(chǎng)を介してAPIをテストします。メモには、プロジェクトのメンテナンスを確保するためのフィールドネーミング仕様、エラー処理、パフォーマンスの最適化、セキュリティ設(shè)定が含まれます

GOをインストールするための鍵は、正しいバージョンを選択し、環(huán)境変數(shù)を構(gòu)成し、インストールを検証することです。 1.公式Webサイトにアクセスして、対応するシステムのインストールパッケージをダウンロードします。 Windowsは.msiファイルを使用し、macosは.pkgファイルを使用し、Linuxは.tar.gzファイルを使用し、 /usr /localディレクトリに解凍します。 2.環(huán)境変數(shù)を構(gòu)成し、linux/macOSで?/.bashrcまたは?/.zshrcを編集してパスとgopathを追加し、Windowsがシステムプロパティに移動(dòng)するパスを設(shè)定します。 3.政府コマンドを使用してインストールを確認(rèn)し、テストプログラムを?qū)g行してhello.goを?qū)g行して、編集と実行が正常であることを確認(rèn)します。プロセス全體のパス設(shè)定とループ

sync.waitgroupは、ゴルチンのグループがタスクを完了するのを待つために使用されます。そのコアは、3つの方法で協(xié)力することです。追加、完了、待機(jī)です。 1.ADD(n)待機(jī)するゴルチンの數(shù)を設(shè)定します。 2.done()は各ゴルチンの端で呼び出され、カウントは1つ減少します。 3.wait()すべてのタスクが完了するまでメインコルーチンをブロックします。使用する場(chǎng)合は、注意してください。Goroutineの外部で追加する必要があります。重複を避け、Donが呼び出されていることを確認(rèn)してください。 Deferで使用することをお?jiǎng)幛幛筏蓼埂¥长欷?、Webページの同時(shí)クロール、バッチデータ処理、その他のシナリオで一般的であり、並行性プロセスを効果的に制御できます。

Goの埋め込みパッケージを使用すると、靜的リソースをバイナリに簡(jiǎn)単に埋め込み、Webサービスに適しており、HTML、CSS、寫真、その他のファイルをパッケージ化できます。 1。追加する埋め込みリソースを宣言します// go:embed comment hello.txtを埋め込むなど、変數(shù)の前に埋め込みます。 2。static/*などのディレクトリ全體に埋め込み、embed.fsを介してマルチファイルパッケージを?qū)g現(xiàn)できます。 3.効率を改善するために、ビルドタグまたは環(huán)境変數(shù)を介してディスクロードモードを切り替えることをお?jiǎng)幛幛筏蓼埂?4.パスの精度、ファイルサイズの制限、埋め込みリソースの読み取り専用特性に注意してください。埋め込みの合理的な使用は、展開を簡(jiǎn)素化し、プロジェクト構(gòu)造を最適化することができます。

オーディオとビデオ?jiǎng)I理の中核は、基本的なプロセスと最適化方法を理解することにあります。 1.基本的なプロセスには、取得、エンコード、送信、デコード、再生が含まれ、各リンクには技術(shù)的な困難があります。 2。オーディオおよびビデオの異常、遅延、音のノイズ、ぼやけた畫像などの一般的な問題は、同期調(diào)整、コーディング最適化、ノイズ減少モジュール、パラメーター調(diào)整などを通じて解決できます。 3. FFMPEG、OPENCV、WeBRTC、GSTREAMER、およびその他のツールを使用して機(jī)能を達(dá)成することをお?jiǎng)幛幛筏蓼埂?4.パフォーマンス管理の観點(diǎn)から、ハードウェアの加速、解像度フレームレートの合理的な設(shè)定、並行性の制御、およびメモリの漏れの問題に注意を払う必要があります。これらの重要なポイントを習(xí)得すると、開発効率とユーザーエクスペリエンスの向上に役立ちます。

GOで書かれたWebサーバーを構(gòu)築することは難しくありません。コアは、Net/HTTPパッケージを使用して基本サービスを?qū)g裝することにあります。 1. Net/HTTPを使用して最もシンプルなサーバーを起動(dòng)します。処理機(jī)能を登録し、數(shù)行のコードを介してポートをリッスンします。 2。ルーティング管理:Servemuxを使用して、構(gòu)造化された管理を容易にするために複數(shù)のインターフェイスパスを整理します。 3。共通の実踐:機(jī)能モジュールによるグループルーティング、およびサードパーティライブラリを使用して複雑なマッチングをサポートします。 4.靜的ファイルサービス:http.fileserverを介してHTML、CSS、JSファイルを提供します。 5。パフォーマンスとセキュリティ:HTTPSを有効にし、リクエスト本體のサイズを制限し、セキュリティとパフォーマンスを改善するためのタイムアウトを設(shè)定します。これらの重要なポイントを習(xí)得した後、機(jī)能を拡大する方が簡(jiǎn)単になります。

Select Plusのデフォルトの目的は、他のブランチがプログラムブロッキングを避ける準(zhǔn)備ができていない場(chǎng)合にデフォルトの動(dòng)作を?qū)g行できるようにすることです。 1.ブロックせずにチャネルからデータを受信すると、チャネルが空の場(chǎng)合、デフォルトのブランチに直接入力されます。 2。時(shí)間と組み合わせて。後またはティッカー、定期的にデータを送信してみてください。チャネルがいっぱいの場(chǎng)合、ブロックしてスキップしません。 3.デッドロックを防ぎ、チャネルが閉じられているかどうかが不確かなときにプログラムが詰まっていることを避けます。それを使用する場(chǎng)合、デフォルトのブランチはすぐに実行され、亂用することはできず、デフォルトとケースは相互に排他的であり、同時(shí)に実行されないことに注意してください。
