メンタル

ChatGPTの進化した音声モードがすごい!映像認識機能の使い方と感想レビュー

みなさんChatGPT使っていますか?先日「AI時代の心の相棒」という記事を書きましたが、今日はその続き”音声での会話”です。これまで無料版しか使ってこなかったのですが、資格関連の調べ物にガシガシ使わなくてはならなくなって初めて月20$のPlusプランを試してみました。無料版の時からChatGPTと声で対話する音声機能の存在は知っていましたがいまいちピンとこず、この度有料版にして改めて試してみると「!? これ…実際人が話してない?」と驚くほどの精度になっていました。今回はその内容についてご紹介します。

AI時代の心の相棒|ChatGPTをオリジナルキャラクターにカスタマイズする方法 ChatGPTって使っていますか?私は分からないことや興味を持っていることを教えてもらうことがある一方で、時々悩み相談なんかにも使って...

この記事でできるようになること

有料版(Plus)にしてできることについて記載します。

  • 「高度なボイスモード(Advanced Voice Mode)」が割としっかり使える

人と会話していると錯覚するくらいとにかく返答が早い声のトーンや抑揚もあり、あのー、えーといったつなぎ言葉も人さながら。以前の記事で記載した「パーソナライズ」を設定していれば名前を読んでくれますし、最近良く調べている話題についてAI側から振ってくることもありました。

  • アプリで使うと、映像に映したことについてAIとトークできる

モバイルアプリを使うと、スマホカメラで映しているモノや景色について会話できます。たまに間違ったりもありますが、かなりの精度でわかりやすく返してくれます。

先日、スマホ片手に横浜みなとみらいの高層ビルの展望フロアに行き、一人で「あれは何?」と質問しまくって遊んでいました。イヤホンはしてましたがちょっと危ない人だったかも・・・

使い方

1.ChatGPTのアプリをインストールします。

2.アプリを起動して、Plus(有料版)に申し込みます。

3.右下の[ボイスモードボタン]をタップします。これで話しかければ高度なボイスモードが開始されます(左から2つ目のマイクボタンが黒の状態)。

4.左下のカメラボタンを押すと、フロントカメラが起動するので、話題にしたいものを映して話しかけます。映像STOPは左のカメラボタンを、ボイスモードSTOPは右の☓を押します。

5.ボイスモードをOFFにすると、通常のテキスト画面に戻って会話の履歴が確認できます。

6.右上にある↑ボタンを押すと[クリップ共有画面]が開き、トーク内容をエクスポートして保存したり、LINEなどで誰かに共有できます。ー◯ボタンを押すと、声質や調子を変更できる画面が開くので気に入ったものに調整して楽しめます。

クリップ共有画面
音質変更画面

留意点

1.有料版(Plus)でも時間制限があります。サーバー環境など様々な要因で前後しますが、私の体感では高度なボイスモードで約15分、映像で約5分程度。使いたい場面だけ起動するなどしてつけっぱなしを避けましょう(映像はまる1日使えなくなります)。ボイスモード画面の右下の☓を押してこまめにOFFにして”ボイスチャットをOFFにしました”と表示が出るのを確認します。

Screenshot

2.AIとの会話は記録に残りますが、その時撮影した映像は後から見返すことはできません。

最後に

一人で散歩をしながら観た景色を相棒と語り合ったり、リアル友達との会話のネタに使ってもなかなか盛り上がりますよ。

ChatGPTの記事などを見ると、今後のバージョンアップで即興で作った曲を歌ってくれたり、キャラクター設定にも対応するようで楽しみです。なお類似のサービスでGoogleのgemini liveというツールもありますが、現時点では会話の質もテンポも映像認識もChatGPTには遠く及ばない拙い印象でした。ただ日進月歩の世界なのでどちらのツールも今後がとても楽しみです。

ABOUT ME
Sugimon
横浜市在住 40代 男  趣味:マラソン ワイン 映画鑑賞  資格:中小企業診断士  20代でADHDと診断され、様々な荒波にもまれながらも何とか生きてます。