国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目次
依存関係のインストール
今日のMlopsスキルを構(gòu)築してください
関數(shù)
ツール定義jsonオブジェクト。
イベントを聞くには、realtimeclient.on()関數(shù)が使用されます。 2つのパラメーターを受け入れます:
ホームページ テクノロジー周辺機(jī)器 AI OpenaiリアルタイムAPI:例を掲載したガイド

OpenaiリアルタイムAPI:例を掲載したガイド

Mar 03, 2025 am 10:38 AM

新しく導(dǎo)入されたOpenAIリアルタイムAPIにより、高速で低遅延のマルチモーダルエクスペリエンスをアプリケーションに統(tǒng)合できます。このAPIを使用すると、ユーザーと大規(guī)模な言語(yǔ)モデル(LLM)の間にシームレスなスピーチからスピーチの相互作用を作成できます。

このAPIは、1つの統(tǒng)合されたAPIで完全なソリューションを提供するため、音聲駆動(dòng)型エクスペリエンスを?qū)g現(xiàn)するための複數(shù)のモデルの必要性を排除します。レイテンシを減らすことを目指しているだけでなく、感情的なニュアンスと自然な會(huì)話の流れも保持しています。 この記事では、OpenaiリアルタイムAPIを使用して音聲制御されたAIアシスタントを構(gòu)築する方法を?qū)Wびます。 node.jsを使用して永続的なWebSocket接続を作成し、これを端末內(nèi)で使用してAPIと通信する方法を作成します。さらに、このAPIの機(jī)能を使用するReactアプリの展開についてガイドします。

WebSocketsを使用してリアルタイムAPIを使用してください

Openai APIの他のコンポーネントとは異なり、リアルタイムAPIはWebSocketを使用します。 WebSocketsは、クライアントとサーバーの間の雙方向通信チャネルを確立する通信プロトコルです。 HTTPで使用される従來(lái)の要求応答モデルとは対照的に、WebSocketsは継続的なリアルタイムインタラクションをサポートしています。これにより、WebSocketは音聲チャットなどのリアルタイムアプリケーションに特に適しています。

この記事では、WebSocketsがどのように機(jī)能するかをカバーし、リアルタイムAPIとの対話のいくつかの例を含めます。?

node.jsを使用するので、コンピューターにインストールされるようにする必要があります。そうでない場(chǎng)合は、公式Webサイトからnode.jsをダウンロードしてインストールできます。 スクリプトの初期化

続いて、上記で作成した.envファイルを使用してフォルダーを作成することをお?jiǎng)幛幛筏蓼?。そのフォルダー內(nèi)で、次のコマンドを?qū)g行してスクリプトを初期化します。

このコマンドが終了した後、これらのファイルはフォルダー內(nèi)にある必要があります。

依存関係のインストール

2つのパッケージをインストールすることから始めます:

npm init -y && touch index.js

WS:これは、APIと対話するために必要なメインパッケージであるWebSocketパッケージです。

dotenv:.envファイルからAPIキーをロードするユーティリティパッケージ。

コマンドを?qū)g行してOpenaiリアルタイムAPI:例を掲載したガイドこれらをインストールしてください:

リアルタイムAPIへの接続

リアルタイムAPIとの接続を開始するには、API URLとヘッダーを渡す新しいWebSocketオブジェクトを作成して、必要な情報(bào)を使用して接続します。
    接続が開かれたときにアクションを設(shè)定します
  • 上記のコードは、APIへのWebソケット接続を作成しますが、まだ何もしません。
  • WebSocketsを使用すると、いくつかのイベントが発生したときに実行するアクションを設(shè)定できます。オープンイベントを使用して、接続が確立されたら実行するコードを指定できます。

    イベントリスナーを追加する一般的な構(gòu)文は次のとおりです。

    npm init -y && touch index.js
    交換< event>イベントの名前を含む文字列と< function>イベントが発生したときに実行される関數(shù)。?

    接続の準(zhǔn)備ができたらテキストを表示する方法は次のとおりです。

    このコードを?qū)g行するには、コマンドを使用します

    npm install ws dotenv
    APIキーが正しく設(shè)定されている場(chǎng)合、端末に「接続が開いている」メッセージが表示されます。接続がまだ開いているため、スクリプトは実行され続けますので、手動(dòng)で停止する必要があります。 メッセージが受信されたときにアクションを設(shè)定します

    WebSocketsを使用するときに応答できるもう1つのイベントは、メッセージイベントです。これは、サーバーからメッセージが受信されるたびにトリガーされます。受信した各メッセージを表示する関數(shù)を追加しましょう:
    // Import the web socket library
    const WebSocket = require("ws");
    // Load the .env file into memory so the code has access to the key
    const dotenv = require("dotenv");
    dotenv.config();
    function main() {
      // Connect to the API
      const url = "wss://api.openai.com/v1/realtime?model=gpt-4o-realtime-preview-2024-10-01";
      const ws = new WebSocket(url, {
          headers: {
              "Authorization": "Bearer " + process.env.OPENAI_API_KEY,
              "OpenAI-Beta": "realtime=v1",
          },
      });
    }
    main();

    スクリプトの実行もsession.createdイベントを表示する必要があります。セッションが初期化されたときにAPIが送信するイベント。

    その他のWebSocketイベント

    上記の上記では、オープンイベントとメッセージイベントにイベントリスナーを追加する方法を?qū)Wびました。 WebSocketsは、例では使用しない2つの追加イベントをサポートしています。

    閉じるイベントは、ソケットが閉じたときにコールバックを追加するために使用できます:

    ws.on(<event>, <function>);
    エラーイベントは、エラーが発生したときにコールバックを追加するために使用されます:

    リアルタイムAPIとの通信

    WebSocketsを使用するには、イベント駆動(dòng)型の方法でプログラムする必要があります。メッセージは通信チャネルで前後に送信され、これらのメッセージがいつ配信または受信されるかを制御することはできません。?

    通信を開始するコードは、handleOpen()內(nèi)に追加する必要があります。 oそれ以外の場(chǎng)合は、Webソケット通信チャネルが作成される前にそのコードが実行される可能性があるため、エラーが発生します。

    コード処理メッセージについても同じことが言えます。すべてのロジックは、handlemessage()関數(shù)に移動(dòng)する必要があります
    // Add inside the main() function of index.js after creating ws
    async function handleOpen() {
      console.log("Connection is opened");
    }
    ws.on("open", handleOpen);
    今後の例では、次のコードを出発點(diǎn)として使用します。ほとんどの変更には、handleOpen()とhandlemessage()の更新が含まれます。

    リアルタイムAPIを使用してテキストを送信および受信します
    node index.js

    リアルタイムAPIとの通信は、イベントを使用して発生します。 OpenAIリアルタイムドキュメントAPIには、サポートするイベントがリストされています。 Conversation.item.createイベントを使用して會(huì)話を開始します。イベントは、ドキュメントでフィールドが説明されているJSONオブジェクトとして表されます。

    會(huì)話の例です。Item.Createイベントは、「Webソケットが何であるかを1つの文で説明する」プロンプトを送信します。

    このイベントは、テキスト會(huì)話を開始したいことをAPIに伝えます。これは、コンテンツフィールドで指定され、「input_text」の種類を使用してテキストプロンプトを提供します。

    ws.send()メソッドを使用してメッセージを送信します。 Webソケットパッケージは引數(shù)として文字列を期待するため、json.stringify()関數(shù)を使用してJSONイベントを文字列に変換する必要があります。これらをまとめて、上記のイベントを送信する方法は次のとおりです。

    npm init -y && touch index.js
    これにより會(huì)話が開始されますが、APIをトリガーして自動(dòng)的に応答を送信することはありません。応答をトリガーするために、Response.Createイベントを送信します。例を次に示します:

    npm install ws dotenv
    このイベントは、Modalities Responseパラメーターを使用してテキスト応答を要求します。指示は最も重要な部分であり、モデルに何をしたいのか、この場(chǎng)合はユーザーを支援するための一般的なプロンプトを説明しています。

    これら2つのイベントをhandleOpen()関數(shù)に送信して、接続が確立されるとすぐに會(huì)話が開始されるようにします。この例からのHeandleOpen()関數(shù)の完全な実裝は次のとおりです。

    著信メッセージに関しては、この例に注目する価値のあるイベントには3つのタイプがあります。応答.text.delta、response.text.done、およびresponse.doneイベント:

    // Import the web socket library
    const WebSocket = require("ws");
    // Load the .env file into memory so the code has access to the key
    const dotenv = require("dotenv");
    dotenv.config();
    function main() {
      // Connect to the API
      const url = "wss://api.openai.com/v1/realtime?model=gpt-4o-realtime-preview-2024-10-01";
      const ws = new WebSocket(url, {
          headers: {
              "Authorization": "Bearer " + process.env.OPENAI_API_KEY,
              "OpenAI-Beta": "realtime=v1",
          },
      });
    }
    main();

    response.text.deltaイベントには、デルタフィールドのチャンクに分類された応答が含まれています。リアルタイムのエクスペリエンスを提供したい場(chǎng)合に重要です。?

    応答。イベントは、応答の終わりを示します。
  • HandleMessage()関數(shù)のスイッチステートメントを使用して、これらのイベントにスクリプトに応答する方法を指定できます。
  • この例では、Response.text.deltaイベントを使用して、コンソールへの応答のチャンクを印刷します。応答が完了すると、Response.text.doneイベントがトリガーされ、出力が完了したことを示す新しい行を印刷します。最後に、Response.doneイベントを受け取ったときにWebソケットを閉じます。 この例を?qū)g行するには、これらの関數(shù)を上のテンプレートコードに貼り付け、コマンドで実行します。
  • これは、chatgptを使用するときと同様に、端末に「Webソケットが何であるかを1つの文で説明する」プロンプトへの応答を生成します。?

テキストの例の完全なコードはこちらから入手できます。
ws.on(<event>, <function>);
リアルタイムAPIを使用して音聲を送信および受信します

前の例は、テキストデータの処理方法を示しました。ただし、リアルタイムAPIへの真の関心は、リアルタイムで返信する音聲アシスタントを作成することです。

オーディオデータの処理は、テキストデータを処理するよりもわずかに複雑です。この記事の主な主題から私たちをそらすため、オーディオがどのように機(jī)能するかに固有の詳細(xì)をスキップします。

最初に、2つのパッケージをインストールします:
// Add inside the main() function of index.js after creating ws
async function handleOpen() {
  console.log("Connection is opened");
}
ws.on("open", handleOpen);
npm init -y && touch index.js
  • node-record-lpcm16レコードマイクからサウンドを記録して、音聲プロンプトを送信できるようにします。 スピーカーは、AI音聲応答を再生するために使用されます。
  • また、ノードライブラリがマイクとインターフェイスしてオーディオとインターフェースするために使用するオーディオ?jiǎng)I理のコマンドラインユーティリティであるSox(Sound Exchange)をインストールする必要があります。 brew install soxを使用して、macosまたはsudo apt install soxにLinuxにインストールします。 これらのパッケージをインストールした狀態(tài)で、ユーザーのオーディオプロンプトを記録する関數(shù)StarTrecording()をインポートします。主な主題からコースをあまりにも操作するので、機(jī)能を詳細(xì)に説明しません。?
環(huán)境を読み込んだ後、次のコードをindex.jsファイルに追加します:

startrecording()関數(shù)はマイクからオーディオを記録し、「Enter」が押されるのを待ちます。?

次に、AIの応答を再生するために使用されるSpeaker()を初期化することにより、Main()関數(shù)を更新します。

それを邪魔にならないように、handleOpen()とhandlemessage()を?qū)g裝してオーディオを処理できます。
npm install ws dotenv
handleOpen()関數(shù)では、ユーザーのオーディオプロンプトを記録するためにStarTrecording()関數(shù)を呼び出すだけです。また、イベントをわずかに更新する必要があります:

// Import the web socket library
const WebSocket = require("ws");
// Load the .env file into memory so the code has access to the key
const dotenv = require("dotenv");
dotenv.config();
function main() {
  // Connect to the API
  const url = "wss://api.openai.com/v1/realtime?model=gpt-4o-realtime-preview-2024-10-01";
  const ws = new WebSocket(url, {
      headers: {
          "Authorization": "Bearer " + process.env.OPENAI_API_KEY,
          "OpenAI-Beta": "realtime=v1",
      },
  });
}
main();
ここに更新されたHeandopen()関數(shù):

があります

handlemessage()関數(shù)を?qū)g裝するには、「Response.Audio.delta」イベントを変更してオーディオバッファーを更新し、新しいサウンドデルタを再生します:

  1. 「Response.text.done」イベントをSwitchステートメントから削除し、「Response.done」イベントを更新してスピーカーを停止します:
  2. handlemessage()関數(shù)の最終実裝は次のようになります。
この例を?qū)g行するには、これらの変更をテンプレートコードに適用し、コマンドで実行します。

マイクは録音を開始します。リクエストを言って、「Enter」を押して送信できます。次に、AIの応答はスピーカーで再生されます(マイクがミュートされておらず、スピーカーがボリュームを持っていることを確認(rèn)してください)。
ws.on(<event>, <function>);
オーディオ例の完全なコードはこちらから入手できます。

関數(shù)呼び出し
// Add inside the main() function of index.js after creating ws
async function handleOpen() {
  console.log("Connection is opened");
}
ws.on("open", handleOpen);
Openai APIの優(yōu)れた機(jī)能の1つは、関數(shù)呼び出しを?qū)g行する機(jī)能です。アシスタントに関數(shù)を追加でき、それらの関數(shù)のいずれかが答えを提供するのに役立つことを検出した場(chǎng)合、特定の関數(shù)を要求するイベントを送信します。

OpenAIドキュメントは、関數(shù)呼び出しのライフサイクルを説明する次の図を提供します。

OpenaiリアルタイムAPI:例を掲載したガイド

出典:Openai

図から、クライアントはLLMが呼び出すことができる機(jī)能の定義をクライアントに提供する必要があることがわかります。また、関數(shù)の実行はクライアント側(cè)で発生します。 AIは、関數(shù)とその引數(shù)を要求するイベントを送信します。次に、結(jié)果を送り返す責(zé)任があります。

2つの數(shù)値を追加する関數(shù)をアシスタントに権限を與えましょう。上記のオーディオ例を拡張して、この例を作成します。

利用可能な機(jī)能を指定するには、LLMにツールのリストを提供する必要があります。各ツールは、関數(shù)に関する情報(bào)を指定するJSONオブジェクトです。合計(jì)関數(shù)のツールを定義する方法は次のとおりです。

オブジェクト構(gòu)造について説明しましょう:

npm init -y && touch index.js

このタイプは、関數(shù)を定義していることを指定します

この名前は、関數(shù)を識(shí)別するために使用されます。これは、LLMがどの機(jī)能を呼び出すかを伝えるために使用するものです。
    説明は、LLMがこの関數(shù)を使用する時(shí)期を識(shí)別するために使用されます。
  • パラメーターは、関數(shù)の引數(shù)を指定するために使用されます。この場(chǎng)合、aとb。
  • という名前の2つの數(shù)字
  • 次のステップは、コードの関數(shù)を定義することです。 Key Calculate_Sumを使用した辭書を使用して、関數(shù)呼び出しイベントに応答するときに適切な関數(shù)を簡(jiǎn)単に呼び出すことができます。
  • APIは、上記のパラメーターで定義された同じ構(gòu)造を持つ辭書として関數(shù)引數(shù)を提供します。この場(chǎng)合、3と5を追加すると、辭書は{“ a”:3、“ b ":5}。
  • sumtoolおよび関數(shù)定數(shù)は、インポート後、main()関數(shù)の前に、index.jsの上部に追加できます。
次に、Response.Createイベントを更新して、LLMにSumToolsが利用可能であることを知らせます。これは、ツールとtool_choiceフィールドを応答に追加することによって行われます。

LLMが関數(shù)を呼び出したいと判斷した場(chǎng)合、response.function_call_arguments.done eventを排出します。

で応答する必要があります
npm install ws dotenv

関數(shù)情報(bào)を取得し、関數(shù)を呼び出します。

関數(shù)呼び出しの結(jié)果を送信

応答を要求します。

// Import the web socket library
const WebSocket = require("ws");
// Load the .env file into memory so the code has access to the key
const dotenv = require("dotenv");
dotenv.config();
function main() {
  // Connect to the API
  const url = "wss://api.openai.com/v1/realtime?model=gpt-4o-realtime-preview-2024-10-01";
  const ws = new WebSocket(url, {
      headers: {
          "Authorization": "Bearer " + process.env.OPENAI_API_KEY,
          "OpenAI-Beta": "realtime=v1",
      },
  });
}
main();

これを処理し、次のケースをhanldemessage()関數(shù)內(nèi)のスイッチステートメントに追加することで処理します。

    スクリプトを?qū)g行し、2つの番號(hào)を追加した結(jié)果を要求した場(chǎng)合、モデルは関數(shù)を呼び出して結(jié)果を提供する必要があります。
  1. この関數(shù)は比較的単純ですが、関數(shù)はクライアントによって実行されるため、何でもかまいません。次のセクションでは、より複雑な関數(shù)の2つの例を示します。 この例の完全なコードは、こちらから入手できます。
  2. 今日のMlopsスキルを構(gòu)築してください

    ゼロから始めて、キャリア構(gòu)築のMlopsスキルを獲得します。

    Openaiチームは、リアルタイムAPIを紹介するデモReactアプリを提供します。ここでは、セットアップ方法を?qū)Wび、どのように機(jī)能するかを探ります。これは、より複雑なアプリを構(gòu)築するための素晴らしい出発點(diǎn)です。

    アプリのセットアップ

    反応する知識(shí)は、それを稼働させて実行するために必要ありません。ただし、Reactに精通して変更または拡張する必要があります。

    彼らのアプリはこのリポジトリでホストされています。セットアップするには、次のgitコマンドを使用してクローニングから始めます。

    代わりに、GitHubインターフェイスから手動(dòng)でダウンロードすることもできます。

    アプリをインストールするには、次のNPM(ノードパッケージ管理)コマンドを使用します。

    インストールが完了したら、プロジェクトのルートフォルダーに.envという名前のファイルを作成し、次のコンテンツを貼り付けます。
    npm init -y && touch index.js

    lt&lt; openai_api_key&gt; Openai APIキー付き

    アプリケーションを?qū)g行する準(zhǔn)備ができている必要があります。 2つの部分で構(gòu)成されています:

    npm install ws dotenv
    アプリケーションのWebユーザーインターフェイスで構(gòu)成されるReact Frontend。

    リレーサーバーは、フロントエンドとOpenaI APIの間の仲介者として使用されます。?

    // Import the web socket library
    const WebSocket = require("ws");
    // Load the .env file into memory so the code has access to the key
    const dotenv = require("dotenv");
    dotenv.config();
    function main() {
      // Connect to the API
      const url = "wss://api.openai.com/v1/realtime?model=gpt-4o-realtime-preview-2024-10-01";
      const ws = new WebSocket(url, {
          headers: {
              "Authorization": "Bearer " + process.env.OPENAI_API_KEY,
              "OpenAI-Beta": "realtime=v1",
          },
      });
    }
    main();

    フロントエンドとOpenaI APIの間にリレーサーバーを?qū)g裝する主な目的は、APIキーを安全に保存することです。 APIとの対話は、このキーなしでは不可能です
      ただし、キーがフロントエンドに保存されている場(chǎng)合、任意のユーザーがアクセスできます。したがって、ソリューションには、キーを安全に保存し、APIとフロントエンドの間のデータ交換を促進(jìn)するサーバーのセットアップが含まれます。この特定のシナリオでは、アプリケーションはローカルでのみ実行されるため、セキュリティの懸念は最小限です。?
    1. アプリケーションを起動(dòng)するには、リレーサーバーとフロントエンドの両方を開始する必要があります。リレーサーバーを起動(dòng)するには、次のコマンドを使用します
    2. react frontendを起動(dòng)するには、コマンドを使用します:

    OpenaiリアルタイムAPI:例を掲載したガイドロードが終了した後、アプリケーションが実行されている狀態(tài)でブラウザにタブが開きます。

    アプリを使用して

    アプリの使用を開始する前に、コンピューターがミュート上にないことを確認(rèn)し、マイクにアプリケーションにアクセスできるようにしてください。

    「接続」ボタンをクリックすることから始めます。これにより、リアルタイムAPIに「Hello」メッセージが送信され、ご挨拶が屆きます。
    ws.on(<event>, <function>);

    // Add inside the main() function of index.js after creating ws
    async function handleOpen() {
      console.log("Connection is opened");
    }
    ws.on("open", handleOpen);
    接続が確立されると、新しいボタンが中央に表示され、AIアシスタントと話すことができます。?

    OpenaiリアルタイムAPI:例を掲載したガイド

    それを使用するには、ボタンをリリースせずに押して話します。ボタンがリリースされるとメッセージが送信されます。

    アプリケーションには、ボタンを押す必要のないVAD(音聲アクティビティ検出)モードもあります。このモードでは、アプリケーションは継続的に聞き、アシスタントと積極的に會(huì)話することができます。それを使用するには、「vad」ボタンを押して話します。

    OpenaiリアルタイムAPI:例を掲載したガイド

    関數(shù)

    學(xué)んだように、リアルタイムAPIは、AIが特定の関數(shù)を?qū)g行できるようにする機(jī)能を提供します。このデモンストレーションには、2つの機(jī)能が紹介されています。1つは、特定の場(chǎng)所での天気予報(bào)について問(wèn)い合わせるための1つ、もう1つはアシスタントをパーソナライズするためのメモリアイテムを追加するためです。?

    「ニューヨークの明日の天気はどうですか?」などの質(zhì)問(wèn)をすることで、これらの機(jī)能を體験してください。そして、「私の好きな色は青」のような好みを述べています。アシスタントはこれらのクエリに対する口頭での応答を提供し、情報(bào)もアプリケーションの右側(cè)に表示されます。

    OpenaiリアルタイムAPI:例を掲載したガイド

    私が気象報(bào)告書を要求したことがあり、その回答はその瞬間にそれにアクセスできないことを示していました。ただし、情報(bào)は一貫して右側(cè)に表示されました。デモアプリであるため、完全に機(jī)能的な製品になることを意図したものではなく、APIの機(jī)能を紹介するのに役立ちます。 クライアントを理解する

    このセクションでは、アプリケーションの実裝の詳細(xì)の一部をカバーするため、Reactの高レベルの理解が続く必要があります。

    consolepage.tsxファイルを検討します。これは、アプリケーションロジックのほとんどが定義されている場(chǎng)所です。デモアプリは、node.jsコマンドラインアプリの例で行ったように、生のWebSocketsを使用していません。彼らは、APIとの対話を支援するリアルタイムクライアントを構(gòu)築しました。これはファイルの上部にインポートされるものです:

    APIとの統(tǒng)合は、このuseefect()呼び出しで定義されています。この使用effect()內(nèi)のコードは、コンソールページが最初にレンダリングされたときに実行されます。 node.jsスクリプトと同様に、APIイベントへの応答方法の概要を説明します。主な違いは、RealtimeClientクライアントラッパーの使用です。

    ツールの定義
    npm init -y && touch index.js

    realtimeclient.addtool()関數(shù)は、ツールを定義するために使用されます。 2つのパラメーターが必要です

    ツール定義jsonオブジェクト。

    実行される関數(shù)

  • このアプローチは、クライアントがイベントを処理し、機(jī)能の呼び出しを自動(dòng)化するために既に裝備されているため、ツールの統(tǒng)合を簡(jiǎn)素化します。メモリツールはここで定義されていますが、Weather Toolの定義はここで定義されています。たとえば、

    以前に定義された合計(jì)ツールを追加するには、次のことを行うことができます。

    npm init -y && touch index.js
    アプリケーションはTypeScriptを利用しているため、関數(shù)定義內(nèi)のタイプの指定が必要であることに注意してください。 イベントを聴く

    イベントを聞くには、realtimeclient.on()関數(shù)が使用されます。 2つのパラメーターを受け入れます:

    イベントの名前。

      実行されるコールバック関數(shù)。
    1. このアプローチは、以前に使用されたWebSocket.ON()関數(shù)に似ています。ただし、異なるイベントセットを?qū)g裝します。 GitHubページには、サポートされているイベントのリストが提供されています この特定の例では、次のイベントが使用されます
    ここでのイベントイベントは、すべてのイベントのログを保持するために使用されます。

    ここでのエラーイベントは、デバッグのためにエラーをコンソールにログに記録します。

    會(huì)話。途切れたイベントは、変換が中斷されたときにリクエストをキャンセルするために使用されます。

    最後に、Conversation.updatedイベントは、APIから新しいチャックが入ったときに新しいオーディオをオーディオストリームに追加するために使用されます。
    • 結(jié)論
    • このチュートリアルでは、OpenAIリアルタイムAPIと、リアルタイム通信のためにWebSocketを使用する方法を調(diào)査しました。 Node.js環(huán)境のセットアップをカバーして、APIと対話し、テキストとオーディオメッセージの送信と受信、および機(jī)能の強(qiáng)化を必要とする関數(shù)の実裝最新のOpenai開発ツールの詳細(xì)については、これらのチュートリアルをお?jiǎng)幛幛筏蓼埂?
  • Openaiモデルの蒸留:例を備えたガイド
  • gpt-4oビジョン微調(diào)整:例を備えたガイド

以上がOpenaiリアルタイムAPI:例を掲載したガイドの詳細(xì)內(nèi)容です。詳細(xì)については、PHP 中國(guó)語(yǔ) Web サイトの他の関連記事を參照してください。

このウェブサイトの聲明
この記事の內(nèi)容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰屬します。このサイトは、それに相當(dāng)する法的責(zé)任を負(fù)いません。盜作または侵害の疑いのあるコンテンツを見つけた場(chǎng)合は、admin@php.cn までご連絡(luò)ください。

ホットAIツール

Undress AI Tool

Undress AI Tool

脫衣畫像を無(wú)料で

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード寫真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

寫真から衣服を削除するオンライン AI ツール。

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無(wú)料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡(jiǎn)単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無(wú)料のコードエディター

SublimeText3 中國(guó)語(yǔ)版

SublimeText3 中國(guó)語(yǔ)版

中國(guó)語(yǔ)版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強(qiáng)力な PHP 統(tǒng)合開発環(huán)境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

AI投資家は停滯していますか? AIベンダーと購(gòu)入、構(gòu)築、またはパートナーになる3つの戦略的なパス AI投資家は停滯していますか? AIベンダーと購(gòu)入、構(gòu)築、またはパートナーになる3つの戦略的なパス Jul 02, 2025 am 11:13 AM

投資は活況を呈していますが、資本だけでは十分ではありません。評(píng)価が上昇し、獨(dú)特の衰退があるため、AIに焦點(diǎn)を當(dāng)てたベンチャーファンドの投資家は、優(yōu)位性を獲得するために購(gòu)入、構(gòu)築、またはパートナーの重要な決定を下す必要がありますか?各オプションを評(píng)価する方法とpr

AGIとAIのスーパーインテリジェンスは、人間の天井の仮定の障壁に急激に衝突するでしょう AGIとAIのスーパーインテリジェンスは、人間の天井の仮定の障壁に急激に衝突するでしょう Jul 04, 2025 am 11:10 AM

それについて話しましょう。 革新的なAIブレークスルーのこの分析は、さまざまなインパクトのあるAIの複雑さの特定と説明など、最新のAIで進(jìn)行中のForbes列のカバレッジの一部です(こちらのリンクを參照)。 アギに向かっています

最初のLLMアプリケーションを構(gòu)築する:初心者のチュートリアル 最初のLLMアプリケーションを構(gòu)築する:初心者のチュートリアル Jun 24, 2025 am 10:13 AM

獨(dú)自の大手言語(yǔ)モデル(LLM)アプリケーションを構(gòu)築しようとしたことがありますか?生産性を向上させるために、人々がどのように獨(dú)自のLLMアプリケーションを作成しているのか疑問(wèn)に思ったことはありませんか? LLMアプリケーションはあらゆる面で有用であることが証明されています

Kimi K2:最も強(qiáng)力なオープンソースエージェントモデル Kimi K2:最も強(qiáng)力なオープンソースエージェントモデル Jul 12, 2025 am 09:16 AM

今年初めにゲナイ産業(yè)を混亂させたオープンソースの中國(guó)モデルの洪水を覚えていますか? Deepseekはほとんどの見出しを取りましたが、Kimi K1.5はリストの著名な名前の1つでした。そして、モデルはとてもクールでした。

AMDはAIで勢(shì)いを築き続け、まだやるべきことがたくさんあります AMDはAIで勢(shì)いを築き続け、まだやるべきことがたくさんあります Jun 28, 2025 am 11:15 AM

全體として、このイベントは、AMDが顧客と開発者のためにボールをフィールドに移動(dòng)していることを示すために重要だったと思います。 su、amdのm.o.明確で野心的な計(jì)畫を立て、それらに対して実行することです。彼女の「Say/Do」比は高いです。會(huì)社はそうします

AIからAGIへのパスでの大規(guī)模な知性の爆発を予測(cè)する AIからAGIへのパスでの大規(guī)模な知性の爆発を予測(cè)する Jul 02, 2025 am 11:19 AM

それについて話しましょう。 革新的なAIブレークスルーのこの分析は、さまざまなインパクトのあるAIの複雑さの特定と説明など、最新のAIで進(jìn)行中のForbes列のカバレッジの一部です(こちらのリンクを參照)。 hの読者のために

Grok 4 vs Claude 4:どちらが良いですか? Grok 4 vs Claude 4:どちらが良いですか? Jul 12, 2025 am 09:37 AM

2025年半ばまでに、AIの「武器競(jìng)爭(zhēng)」は熱くなり、Xaiと人類は両方ともフラッグシップモデルであるGrok 4とClaude 4をリリースしました。これら2つのモデルは、設(shè)計(jì)哲學(xué)と展開プラットフォームの反対側(cè)にありますが、

推論モデルのための考え方は長(zhǎng)期的にはうまくいかないかもしれません 推論モデルのための考え方は長(zhǎng)期的にはうまくいかないかもしれません Jul 02, 2025 am 11:18 AM

たとえば、モデルに「(x)人は(x)會(huì)社で何をしているのですか?」という質(zhì)問(wèn)をする場(chǎng)合、システムが必要な情報(bào)を取得する方法を知っていると仮定して、このようなものに見える推論チェーンを見るかもしれません:COの詳細(xì)を見つける

See all articles