OpenAI、新しい音声インテリジェンス機能をAPIに追加!

要約

OpenAIは、開発者がユーザーとの会話を行うアプリを作成できる新しい音声インテリジェンス機能をAPIに追加したと発表しました。新たに登場するGPT‑Realtime‑2は、ユーザーと会話できるリアルな音声シミュレーションを提供し、前モデルよりも複雑なリクエストに対応できるようにGPT‑5クラスの推論能力を備えています。また、GPT‑Realtime‑Translateは、70以上の入力言語と13の出力言語をサポートし、リアルタイムで会話の翻訳を提供します。さらに、GPT-Realtime-Whisperは、ライブでの音声からテキストへの変換機能を提供します。

これらの新機能は、顧客サービスの拡張を目指す企業にとって非常に有益です。教育、メディア、イベント、クリエイタープラットフォームなど、さまざまな分野でも活用されることが期待されています。しかし、これらのツールが悪用される可能性もあるため、OpenAIはスパムや詐欺などのオンラインの悪用を防ぐためのガードレールを設けています。特定のトリガーがシステムに組み込まれ、危険なコンテンツガイドラインに違反する会話を検知して停止することができます。

OpenAIは、これらの新機能がリアルタイム音声を単なる応答から、実際に作業を行う音声インターフェースへと進化させると述べています。これにより、ユーザーとのインタラクションがよりスムーズに行えることが期待され、企業の業務効率化にも貢献するでしょう。新たな音声モデルは、OpenAIのRealtime APIに含まれ、利用料金は分単位またはトークン消費に基づいて課金されます。


元記事: https://techcrunch.com/2026/05/07/openai-launches-new-voice-intelligence-features-in-its-api/

公開日: Thu, 07 May 2026 22:24:50 +0000


この記事はAIアシスト編集により作成されています。

📰 元記事: 元記事を読む

コメントする