a级特黄的片子,99久久国语露脸精品国产

依存関係のインストール

今日のMlopsスキルを構(gòu)築してください

関數(shù)

ツール定義jsonオブジェクト。

イベントを聞くには、realtimeclient.on（）関數(shù)が使用されます。 2つのパラメーターを受け入れます：

ホームページ

テクノロジー周辺機(jī)器

OpenaiリアルタイムAPI：例を掲載したガイド

Jennifer Aniston

Mar 03, 2025 am 10:38 AM

新しく導(dǎo)入されたOpenAIリアルタイムAPIにより、高速で低遅延のマルチモーダルエクスペリエンスをアプリケーションに統(tǒng)合できます。このAPIを使用すると、ユーザーと大規(guī)模な言語(yǔ)モデル（LLM）の間にシームレスなスピーチからスピーチの相互作用を作成できます。

このAPIは、1つの統(tǒng)合されたAPIで完全なソリューションを提供するため、音聲駆動(dòng)型エクスペリエンスを?qū)g現(xiàn)するための複數(shù)のモデルの必要性を排除します。レイテンシを減らすことを目指しているだけでなく、感情的なニュアンスと自然な會(huì)話の流れも保持しています。この記事では、OpenaiリアルタイムAPIを使用して音聲制御されたAIアシスタントを構(gòu)築する方法を?qū)Wびます。 node.jsを使用して永続的なWebSocket接続を作成し、これを端末內(nèi)で使用してAPIと通信する方法を作成します。さらに、このAPIの機(jī)能を使用するReactアプリの展開についてガイドします。

WebSocketsを使用してリアルタイムAPIを使用してください

Openai APIの他のコンポーネントとは異なり、リアルタイムAPIはWebSocketを使用します。 WebSocketsは、クライアントとサーバーの間の雙方向通信チャネルを確立する通信プロトコルです。 HTTPで使用される従來(lái)の要求応答モデルとは対照的に、WebSocketsは継続的なリアルタイムインタラクションをサポートしています。これにより、WebSocketは音聲チャットなどのリアルタイムアプリケーションに特に適しています。

この記事では、WebSocketsがどのように機(jī)能するかをカバーし、リアルタイムAPIとの対話のいくつかの例を含めます。?

node.jsを使用するので、コンピューターにインストールされるようにする必要があります。そうでない場(chǎng)合は、公式Webサイトからnode.jsをダウンロードしてインストールできます。スクリプトの初期化

続いて、上記で作成した.envファイルを使用してフォルダーを作成することをお?jiǎng)幛幛筏蓼?。そのフォルダー內(nèi)で、次のコマンドを?qū)g行してスクリプトを初期化します。

このコマンドが終了した後、これらのファイルはフォルダー內(nèi)にある必要があります。

依存関係のインストール

2つのパッケージをインストールすることから始めます：

npm init -y && touch index.js

WS：これは、APIと対話するために必要なメインパッケージであるWebSocketパッケージです。

dotenv：.envファイルからAPIキーをロードするユーティリティパッケージ。

コマンドを?qū)g行して OpenaiリアルタイムAPI：例を掲載したガイドこれらをインストールしてください：

リアルタイムAPIへの接続

リアルタイムAPIとの接続を開始するには、API URLとヘッダーを渡す新しいWebSocketオブジェクトを作成して、必要な情報(bào)を使用して接続します。

WebSocketsを使用すると、いくつかのイベントが発生したときに実行するアクションを設(shè)定できます。オープンイベントを使用して、接続が確立されたら実行するコードを指定できます。
イベントリスナーを追加する一般的な構(gòu)文は次のとおりです。
```
npm init -y && touch index.js
```
交換＆lt; event＆gt;イベントの名前を含む文字列と＆lt; function＆gt;イベントが発生したときに実行される関數(shù)。?

接続の準(zhǔn)備ができたらテキストを表示する方法は次のとおりです。
このコードを?qū)g行するには、コマンドを使用します
```
npm install ws dotenv
```
APIキーが正しく設(shè)定されている場(chǎng)合、端末に「接続が開いている」メッセージが表示されます。接続がまだ開いているため、スクリプトは実行され続けますので、手動(dòng)で停止する必要があります。メッセージが受信されたときにアクションを設(shè)定します

WebSocketsを使用するときに応答できるもう1つのイベントは、メッセージイベントです。これは、サーバーからメッセージが受信されるたびにトリガーされます。受信した各メッセージを表示する関數(shù)を追加しましょう：
```
// Import the web socket library
const WebSocket = require("ws");
// Load the .env file into memory so the code has access to the key
const dotenv = require("dotenv");
dotenv.config();
function main() {
  // Connect to the API
  const url = "wss://api.openai.com/v1/realtime?model=gpt-4o-realtime-preview-2024-10-01";
  const ws = new WebSocket(url, {
      headers: {
          "Authorization": "Bearer " + process.env.OPENAI_API_KEY,
          "OpenAI-Beta": "realtime=v1",
      },
  });
}
main();
```
スクリプトの実行もsession.createdイベントを表示する必要があります。セッションが初期化されたときにAPIが送信するイベント。
その他のWebSocketイベント
上記の上記では、オープンイベントとメッセージイベントにイベントリスナーを追加する方法を?qū)Wびました。 WebSocketsは、例では使用しない2つの追加イベントをサポートしています。
閉じるイベントは、ソケットが閉じたときにコールバックを追加するために使用できます：
```
ws.on(<event>, <function>);
```
エラーイベントは、エラーが発生したときにコールバックを追加するために使用されます：

リアルタイムAPIとの通信

WebSocketsを使用するには、イベント駆動(dòng)型の方法でプログラムする必要があります。メッセージは通信チャネルで前後に送信され、これらのメッセージがいつ配信または受信されるかを制御することはできません。?

通信を開始するコードは、handleOpen（）內(nèi)に追加する必要があります。 oそれ以外の場(chǎng)合は、Webソケット通信チャネルが作成される前にそのコードが実行される可能性があるため、エラーが発生します。
コード処理メッセージについても同じことが言えます。すべてのロジックは、handlemessage（）関數(shù)に移動(dòng)する必要があります
```
// Add inside the main() function of index.js after creating ws
async function handleOpen() {
  console.log("Connection is opened");
}
ws.on("open", handleOpen);
```
今後の例では、次のコードを出発點(diǎn)として使用します。ほとんどの変更には、handleOpen（）とhandlemessage（）の更新が含まれます。

リアルタイムAPIを使用してテキストを送信および受信します
```
node index.js
```
リアルタイムAPIとの通信は、イベントを使用して発生します。 OpenAIリアルタイムドキュメントAPIには、サポートするイベントがリストされています。 Conversation.item.createイベントを使用して會(huì)話を開始します。イベントは、ドキュメントでフィールドが説明されているJSONオブジェクトとして表されます。
會(huì)話の例です。Item.Createイベントは、「Webソケットが何であるかを1つの文で説明する」プロンプトを送信します。

このイベントは、テキスト會(huì)話を開始したいことをAPIに伝えます。これは、コンテンツフィールドで指定され、「input_text」の種類を使用してテキストプロンプトを提供します。
ws.send（）メソッドを使用してメッセージを送信します。 Webソケットパッケージは引數(shù)として文字列を期待するため、json.stringify（）関數(shù)を使用してJSONイベントを文字列に変換する必要があります。これらをまとめて、上記のイベントを送信する方法は次のとおりです。
```
npm init -y && touch index.js
```
これにより會(huì)話が開始されますが、APIをトリガーして自動(dòng)的に応答を送信することはありません。応答をトリガーするために、Response.Createイベントを送信します。例を次に示します：
```
npm install ws dotenv
```
このイベントは、Modalities Responseパラメーターを使用してテキスト応答を要求します。指示は最も重要な部分であり、モデルに何をしたいのか、この場(chǎng)合はユーザーを支援するための一般的なプロンプトを説明しています。
これら2つのイベントをhandleOpen（）関數(shù)に送信して、接続が確立されるとすぐに會(huì)話が開始されるようにします。この例からのHeandleOpen（）関數(shù)の完全な実裝は次のとおりです。

著信メッセージに関しては、この例に注目する価値のあるイベントには3つのタイプがあります。応答.text.delta、response.text.done、およびresponse.doneイベント：
```
// Import the web socket library
const WebSocket = require("ws");
// Load the .env file into memory so the code has access to the key
const dotenv = require("dotenv");
dotenv.config();
function main() {
  // Connect to the API
  const url = "wss://api.openai.com/v1/realtime?model=gpt-4o-realtime-preview-2024-10-01";
  const ws = new WebSocket(url, {
      headers: {
          "Authorization": "Bearer " + process.env.OPENAI_API_KEY,
          "OpenAI-Beta": "realtime=v1",
      },
  });
}
main();
```
response.text.deltaイベントには、デルタフィールドのチャンクに分類された応答が含まれています。リアルタイムのエクスペリエンスを提供したい場(chǎng)合に重要です。?
応答。イベントは、応答の終わりを示します。
HandleMessage（）関數(shù)のスイッチステートメントを使用して、これらのイベントにスクリプトに応答する方法を指定できます。

テキストの例の完全なコードはこちらから入手できます。

ws.on(<event>, <function>);

リアルタイムAPIを使用して音聲を送信および受信します

前の例は、テキストデータの処理方法を示しました。ただし、リアルタイムAPIへの真の関心は、リアルタイムで返信する音聲アシスタントを作成することです。

オーディオデータの処理は、テキストデータを処理するよりもわずかに複雑です。この記事の主な主題から私たちをそらすため、オーディオがどのように機(jī)能するかに固有の詳細(xì)をスキップします。

最初に、2つのパッケージをインストールします：

// Add inside the main() function of index.js after creating ws
async function handleOpen() {
  console.log("Connection is opened");
}
ws.on("open", handleOpen);

npm init -y && touch index.js

node-record-lpcm16レコードマイクからサウンドを記録して、音聲プロンプトを送信できるようにします。スピーカーは、AI音聲応答を再生するために使用されます。
また、ノードライブラリがマイクとインターフェイスしてオーディオとインターフェースするために使用するオーディオ?jiǎng)I理のコマンドラインユーティリティであるSox（Sound Exchange）をインストールする必要があります。 brew install soxを使用して、macosまたはsudo apt install soxにLinuxにインストールします。これらのパッケージをインストールした狀態(tài)で、ユーザーのオーディオプロンプトを記録する関數(shù)StarTrecording（）をインポートします。主な主題からコースをあまりにも操作するので、機(jī)能を詳細(xì)に説明しません。?

環(huán)境を読み込んだ後、次のコードをindex.jsファイルに追加します：

startrecording（）関數(shù)はマイクからオーディオを記録し、「Enter」が押されるのを待ちます。?

次に、AIの応答を再生するために使用されるSpeaker（）を初期化することにより、Main（）関數(shù)を更新します。

それを邪魔にならないように、handleOpen（）とhandlemessage（）を?qū)g裝してオーディオを処理できます。

npm install ws dotenv

handleOpen（）関數(shù)では、ユーザーのオーディオプロンプトを記録するためにStarTrecording（）関數(shù)を呼び出すだけです。また、イベントをわずかに更新する必要があります：

// Import the web socket library
const WebSocket = require("ws");
// Load the .env file into memory so the code has access to the key
const dotenv = require("dotenv");
dotenv.config();
function main() {
  // Connect to the API
  const url = "wss://api.openai.com/v1/realtime?model=gpt-4o-realtime-preview-2024-10-01";
  const ws = new WebSocket(url, {
      headers: {
          "Authorization": "Bearer " + process.env.OPENAI_API_KEY,
          "OpenAI-Beta": "realtime=v1",
      },
  });
}
main();

ここに更新されたHeandopen（）関數(shù)：

があります

handlemessage（）関數(shù)を?qū)g裝するには、「Response.Audio.delta」イベントを変更してオーディオバッファーを更新し、新しいサウンドデルタを再生します：

「Response.text.done」イベントをSwitchステートメントから削除し、「Response.done」イベントを更新してスピーカーを停止します：

この例を?qū)g行するには、これらの変更をテンプレートコードに適用し、コマンドで実行します。

マイクは録音を開始します。リクエストを言って、「Enter」を押して送信できます。次に、AIの応答はスピーカーで再生されます（マイクがミュートされておらず、スピーカーがボリュームを持っていることを確認(rèn)してください）。

ws.on(<event>, <function>);

オーディオ例の完全なコードはこちらから入手できます。

関數(shù)呼び出し

// Add inside the main() function of index.js after creating ws
async function handleOpen() {
  console.log("Connection is opened");
}
ws.on("open", handleOpen);

Openai APIの優(yōu)れた機(jī)能の1つは、関數(shù)呼び出しを?qū)g行する機(jī)能です。アシスタントに関數(shù)を追加でき、それらの関數(shù)のいずれかが答えを提供するのに役立つことを検出した場(chǎng)合、特定の関數(shù)を要求するイベントを送信します。

OpenAIドキュメントは、関數(shù)呼び出しのライフサイクルを説明する次の図を提供します。

OpenaiリアルタイムAPI：例を掲載したガイド

出典：Openai

図から、クライアントはLLMが呼び出すことができる機(jī)能の定義をクライアントに提供する必要があることがわかります。また、関數(shù)の実行はクライアント側(cè)で発生します。 AIは、関數(shù)とその引數(shù)を要求するイベントを送信します。次に、結(jié)果を送り返す責(zé)任があります。

2つの數(shù)値を追加する関數(shù)をアシスタントに権限を與えましょう。上記のオーディオ例を拡張して、この例を作成します。

利用可能な機(jī)能を指定するには、LLMにツールのリストを提供する必要があります。各ツールは、関數(shù)に関する情報(bào)を指定するJSONオブジェクトです。合計(jì)関數(shù)のツールを定義する方法は次のとおりです。

オブジェクト構(gòu)造について説明しましょう：

npm init -y && touch index.js

このタイプは、関數(shù)を定義していることを指定します

この名前は、関數(shù)を識(shí)別するために使用されます。これは、LLMがどの機(jī)能を呼び出すかを伝えるために使用するものです。

パラメーターは、関數(shù)の引數(shù)を指定するために使用されます。この場(chǎng)合、aとb。
sumtoolおよび関數(shù)定數(shù)は、インポート後、main（）関數(shù)の前に、index.jsの上部に追加できます。

次に、Response.Createイベントを更新して、LLMにSumToolsが利用可能であることを知らせます。これは、ツールとtool_choiceフィールドを応答に追加することによって行われます。

LLMが関數(shù)を呼び出したいと判斷した場(chǎng)合、response.function_call_arguments.done eventを排出します。

で応答する必要があります

npm install ws dotenv

関數(shù)情報(bào)を取得し、関數(shù)を呼び出します。

関數(shù)呼び出しの結(jié)果を送信

応答を要求します。

// Import the web socket library
const WebSocket = require("ws");
// Load the .env file into memory so the code has access to the key
const dotenv = require("dotenv");
dotenv.config();
function main() {
  // Connect to the API
  const url = "wss://api.openai.com/v1/realtime?model=gpt-4o-realtime-preview-2024-10-01";
  const ws = new WebSocket(url, {
      headers: {
          "Authorization": "Bearer " + process.env.OPENAI_API_KEY,
          "OpenAI-Beta": "realtime=v1",
      },
  });
}
main();

これを処理し、次のケースをhanldemessage（）関數(shù)內(nèi)のスイッチステートメントに追加することで処理します。

この関數(shù)は比較的単純ですが、関數(shù)はクライアントによって実行されるため、何でもかまいません。次のセクションでは、より複雑な関數(shù)の2つの例を示します。この例の完全なコードは、こちらから入手できます。

今日のMlopsスキルを構(gòu)築してください

Openaiチームは、リアルタイムAPIを紹介するデモReactアプリを提供します。ここでは、セットアップ方法を?qū)Wび、どのように機(jī)能するかを探ります。これは、より複雑なアプリを構(gòu)築するための素晴らしい出発點(diǎn)です。

彼らのアプリはこのリポジトリでホストされています。セットアップするには、次のgitコマンドを使用してクローニングから始めます。

代わりに、GitHubインターフェイスから手動(dòng)でダウンロードすることもできます。

npm init -y && touch index.js

lt＆lt; openai_api_key＆gt; Openai APIキー付き

npm install ws dotenv

リレーサーバーは、フロントエンドとOpenaI APIの間の仲介者として使用されます。?

// Import the web socket library
const WebSocket = require("ws");
// Load the .env file into memory so the code has access to the key
const dotenv = require("dotenv");
dotenv.config();
function main() {
  // Connect to the API
  const url = "wss://api.openai.com/v1/realtime?model=gpt-4o-realtime-preview-2024-10-01";
  const ws = new WebSocket(url, {
      headers: {
          "Authorization": "Bearer " + process.env.OPENAI_API_KEY,
          "OpenAI-Beta": "realtime=v1",
      },
  });
}
main();

OpenaiリアルタイムAPI：例を掲載したガイドロードが終了した後、アプリケーションが実行されている狀態(tài)でブラウザにタブが開きます。

アプリを使用して

アプリの使用を開始する前に、コンピューターがミュート上にないことを確認(rèn)し、マイクにアプリケーションにアクセスできるようにしてください。

ws.on(<event>, <function>);

// Add inside the main() function of index.js after creating ws
async function handleOpen() {
  console.log("Connection is opened");
}
ws.on("open", handleOpen);

OpenaiリアルタイムAPI：例を掲載したガイド

それを使用するには、ボタンをリリースせずに押して話します。ボタンがリリースされるとメッセージが送信されます。

アプリケーションには、ボタンを押す必要のないVAD（音聲アクティビティ検出）モードもあります。このモードでは、アプリケーションは継続的に聞き、アシスタントと積極的に會(huì)話することができます。それを使用するには、「vad」ボタンを押して話します。

OpenaiリアルタイムAPI：例を掲載したガイド

関數(shù)

學(xué)んだように、リアルタイムAPIは、AIが特定の関數(shù)を?qū)g行できるようにする機(jī)能を提供します。このデモンストレーションには、2つの機(jī)能が紹介されています。1つは、特定の場(chǎng)所での天気予報(bào)について問(wèn)い合わせるための1つ、もう1つはアシスタントをパーソナライズするためのメモリアイテムを追加するためです。?

「ニューヨークの明日の天気はどうですか？」などの質(zhì)問(wèn)をすることで、これらの機(jī)能を體験してください。そして、「私の好きな色は青」のような好みを述べています。アシスタントはこれらのクエリに対する口頭での応答を提供し、情報(bào)もアプリケーションの右側(cè)に表示されます。

OpenaiリアルタイムAPI：例を掲載したガイド

このセクションでは、アプリケーションの実裝の詳細(xì)の一部をカバーするため、Reactの高レベルの理解が続く必要があります。

APIとの統(tǒng)合は、このuseefect（）呼び出しで定義されています。この使用effect（）內(nèi)のコードは、コンソールページが最初にレンダリングされたときに実行されます。 node.jsスクリプトと同様に、APIイベントへの応答方法の概要を説明します。主な違いは、RealtimeClientクライアントラッパーの使用です。

npm init -y && touch index.js

realtimeclient.addtool（）関數(shù)は、ツールを定義するために使用されます。 2つのパラメーターが必要です

ツール定義jsonオブジェクト。

実行される関數(shù)

このアプローチは、クライアントがイベントを処理し、機(jī)能の呼び出しを自動(dòng)化するために既に裝備されているため、ツールの統(tǒng)合を簡(jiǎn)素化します。メモリツールはここで定義されていますが、Weather Toolの定義はここで定義されています。たとえば、
以前に定義された合計(jì)ツールを追加するには、次のことを行うことができます。
```
npm init -y && touch index.js
```
アプリケーションはTypeScriptを利用しているため、関數(shù)定義內(nèi)のタイプの指定が必要であることに注意してください。イベントを聴く

イベントを聞くには、realtimeclient.on（）関數(shù)が使用されます。 2つのパラメーターを受け入れます：

イベントの名前。
2. このアプローチは、以前に使用されたWebSocket.ON（）関數(shù)に似ています。ただし、異なるイベントセットを?qū)g裝します。 GitHubページには、サポートされているイベントのリストが提供されていますこの特定の例では、次のイベントが使用されます
ここでのイベントイベントは、すべてのイベントのログを保持するために使用されます。
ここでのエラーイベントは、デバッグのためにエラーをコンソールにログに記録します。

會(huì)話。途切れたイベントは、変換が中斷されたときにリクエストをキャンセルするために使用されます。
最後に、Conversation.updatedイベントは、APIから新しいチャックが入ったときに新しいオーディオをオーディオストリームに追加するために使用されます。
- 結(jié)論
Openaiモデルの蒸留：例を備えたガイド
gpt-4oビジョン微調(diào)整：例を備えたガイド

以上がOpenaiリアルタイムAPI：例を掲載したガイドの詳細(xì)內(nèi)容です。詳細(xì)については、PHP 中國(guó)語(yǔ) Web サイトの他の関連記事を參照してください。

このウェブサイトの聲明

この記事の內(nèi)容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰屬します。このサイトは、それに相當(dāng)する法的責(zé)任を負(fù)いません。盜作または侵害の疑いのあるコンテンツを見つけた場(chǎng)合は、admin@php.cn までご連絡(luò)ください。

ホットAIツール

Undress AI Tool

脫衣畫像を無(wú)料で

Undresser.AI Undress

リアルなヌード寫真を作成する AI 搭載アプリ

AI Clothes Remover

寫真から衣服を削除するオンライン AI ツール。

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無(wú)料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡(jiǎn)単に交換できます。

ホットツール

メモ帳++7.3.1

使いやすく無(wú)料のコードエディター

SublimeText3 中國(guó)語(yǔ)版

中國(guó)語(yǔ)版、とても使いやすい

ゼンドスタジオ 13.0.1

強(qiáng)力な PHP 統(tǒng)合開発環(huán)境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

8648

Java チュートリアル

1791

CakePHP チュートリアル

1733

Laravel チュートリアル

1583

PHP チュートリアル

1453

Related knowledge

AI投資家は停滯していますか？ AIベンダーと購(gòu)入、構(gòu)築、またはパートナーになる3つの戦略的なパス Jul 02, 2025 am 11:13 AM

投資は活況を呈していますが、資本だけでは十分ではありません。評(píng)価が上昇し、獨(dú)特の衰退があるため、AIに焦點(diǎn)を當(dāng)てたベンチャーファンドの投資家は、優(yōu)位性を獲得するために購(gòu)入、構(gòu)築、またはパートナーの重要な決定を下す必要がありますか？各オプションを評(píng)価する方法とpr

AGIとAIのスーパーインテリジェンスは、人間の天井の仮定の障壁に急激に衝突するでしょう Jul 04, 2025 am 11:10 AM

それについて話しましょう。革新的なAIブレークスルーのこの分析は、さまざまなインパクトのあるAIの複雑さの特定と説明など、最新のAIで進(jìn)行中のForbes列のカバレッジの一部です（こちらのリンクを參照）。アギに向かっています

最初のLLMアプリケーションを構(gòu)築する：初心者のチュートリアル Jun 24, 2025 am 10:13 AM

獨(dú)自の大手言語(yǔ)モデル（LLM）アプリケーションを構(gòu)築しようとしたことがありますか？生産性を向上させるために、人々がどのように獨(dú)自のLLMアプリケーションを作成しているのか疑問(wèn)に思ったことはありませんか？ LLMアプリケーションはあらゆる面で有用であることが証明されています