Openaiは、革新的なチャットボットChatGptの大幅な改善を常に考えてきました。今回は、ユーザーが自分の音声を使用してプロンプトできるようにするために、チャットボットに付与された音声機能です。 ChATGPTの今後の更新により、ユーザーは音声を選択し、簡単にChatGPTを通過するプロンプトを簡単に提供できます。
Openaiは、ChatGptが人工知能の世界で常に優れた場所を維持することを保証することに関して、石を裏返しにしません。以前は、ユーザーはテキストを使用してAIチャットボットにプロンプトを提供することしかできませんでしたが、今では音声と画像を通じてクイックプロンプトを提供できます。
Openaiが言うように、「ChatGptは今、見て、聞いて、話すことができます」、AIチャットボットは、画像や音声ノートを通じて送信されるプロンプトに効果的に応答することができます。丸で囲まれた数学の問題のイメージを送っても、声の会話を通して家に帰る途中で目撃した美しい光景について話し合いたい場合でも、すべてを行うことができます!
ChatGptは、友人と実際の電話での会話をしているように感じさせることで、あなたのプロンプトに即座に応答します。これは、チャットボットに参加するのに最適な方法です。
更新は、グローバルにユーザーのために展開され始めました。 Openaiの公式ブログ投稿は、次のように述べています。 VoiceはiOSとAndroid(設定のオプトイン)で提供され、すべてのプラットフォームで画像が利用可能になります。」
新しい音声機能にアクセスするには、アプリの設定に移動して新しい機能をクリックする必要があります。次に、右上隅にあるヘッドフォンボタンを探します。 5つの音声オプションがあり、1つの優先オプションを選択する必要があります。
Openaiは、音声機能がテキストからスピーチモデルを搭載していると説明しました。ブログ投稿で、彼らは次のように述べています。「私たちはプロの声優と協力して、それぞれの声を作成しました。また、オープンソースの音声認識システムであるWhisperを使用して、話された単語をテキストに転写します。」
一方、画像機能は搭載されていますマルチモーダルGPT-3.5およびGPT-4モデル。これらのモデルの言語推論スキルを介した画像の理解により、チャットボットは、テキストドキュメント、スクリーンショット、カメラの写真など、幅広い画像を理解できます。
音声機能により、ChatGptは、Amazon Alexa、AppleのSiriなどの他のAI音声アシスタントに少し近づいています。これらの機能により、ユーザーエクスペリエンスが向上し、ユーザーがChatGPTをより頻繁に、より広く、より効果的に使用できるようになります。
Pallavi Singhは、テクノロジーの熱心な作家です。彼女は、ガジェットとテクノロジーの世界についての新しいことについて書くのが大好きです。彼女が書くのに忙しくないとき、彼女はギターを弾くのに時間を費やします。