ChatGPT4o 良いところTOP5 | 読み方や価格、音声について
4コマ漫画や記事一覧追加 by イラレブック Tweet
OpenAIから自然に会話できる新しいChatGPT4oが発表された
2024年5月14日(火)にChatGPTで有名なOpenAIから新しいモデル「Chat GPT4o」が発表された。
読み方は「チャットジーピーティーフォーオー」だ。
紹介された動画では、凄まじいほどの性能を見せており、その特徴はまず「速度」。人間の質問に対して0.何秒単位の世界で即答するため、とても自然な会話が可能。ついにAIが即答する時代が来たのかとこれには胸がときめいた。
さらに画像や音声データも正確に読み込めるようになったらしく、これまでテキストしか読み取れなかったChatGPT4が画像や音声を物凄い速度で理解して反応しているのが動画でもわかる。
そんなとんでもない新型「ChatGPT4o」だが、なんと発表のあった日から「Chat GPT4o」が使えるようになっているではないか!
月額課金のサブスクに加入しているChatGPT Plusユーザーは使えるようになっているようだ。
早速使ってみて、良い順にTOP5にしたので参考にしてほしい。ちなみにChat-GPT Plusでも速度や精度が上がったChatGPT4 Turboが使えなくて、まだかまだかと待っていたので、かなり嬉しかった。
画像を正確に読み取れる
まず、早速テキストを入れるところに画像を読み込めるボタンが配置されており、基本はそこを押すことで好きな画像を読み取ってもらえることができるようになった。ChatGPT4ではそもそも読み取れないし、Geminiなどでも画像を読み込めても種類によっては「まだこの画像は対応していません」などと言われたりして、画像認識はあまり使えない印象だったがChatGPT4oは違う。本当にテキストレベルに使えるものとなっており、テキスト認識だけではできないことができるようになった。
まず確実に便利な用途としては、文字認識(OCR)だ。これは画像内にある文字を読み取りテキストを抜き出してくれる機能だが、これまでは別のツールなどで画像を読み取らせてテキストを抜き出していたが問題があった。それは文字とは言えないようなマークや配置のされ方によっては人間側で必要な箇所を切り取ってから分割して読み取ってもらうような必要があったのだが、今回のo(オー)では、画像の文字を正確に読み取るのはもちろん、画像の構造も把握してくれるので、プロンプト次第では一発で上図のように表のような形でそのまま抜き出すことができた。これは相当便利だし、従来の画像文字抽出サービスが丸ごとシェアを奪われるほどの性能で、実際私は今後こちらを利用することになるだろうと感じた。他にも従来読み取れなかった複雑な画像を把握したり、評価や自動タグ付けと分類などもできるようで今後どんどん活用して紹介していきたい機能だ。
音声も読みとれる‥が、ここはまだ発展途上
実用レベルは画像よりも低いが、音声が読み取れるのは新鮮で、なかなか興味深いため4位とした。
期待の音声認識は残念ながら現状まだ初歩的な解析に留まっているようだ。現状読み取れる形式は、MP3、WAV、AAC、OGGファイルで、.m4aなどは読み込めなかった。私が試してできたことは、その音楽の再生時間(約7.78秒など)、チャンネル数: ステレオ(2チャンネルなど)、サンプル幅: 2バイトなど、フレームレート: 44100Hz(サンプル数/秒など)を解析するぐらいだった。音楽の雰囲気や内容までは現状まだうまく分析できなさそうである。
今後進化すれば好きな音楽の歌詞をテキスト化してもらったり、会議で録音した音声をテキスト化したり、プロンプト次第では必要な情報だけを音声から抽出してもらったりなどの活用に期待したい。
学習データが新しい
ChatGPT3.5では2022年まで、ChatGPT4では2023年(前半)までだったが、o(オー)は2023年9月までのデータで学習されているので、これまでよりも新しい情報がベースとなって学習しているので、新しい情報についても自然にやりとりできるようになった。ちなみにTurboでは、夏頃発売の商品についてもデータがない点を考えると、Turboよりも新しいデータで学習されていることがわかる。
ChatGPT4より賢い
これはChatGPT4を使う人なら純粋に嬉しい性能。使った上で結論から言うと、処理精度が格段に上がったと感じた。
簡単にわかるところから言うと、ChatGPT4ではスクリプトを依頼しても手抜きするような形で、「ここ以降は上と同様に自分で記載してください」のような対応をされることがあったが、そのような手抜き感はo(オー)ではなくなった。ここはChatGPT4を使う人なら確実に便利になったと感じる部分だろう。
ちなみにChatGPT4 Turboを仕事上使う機会があるのだが、TurboはChatGPT4では作れない長く複雑なスクリプトも素早く精度高く生成してくれる。そのため、Turboが使えるのを心待ちにしていたのだが、その性能に近しい精度をo(オー)から感じ取れた。実際ChatGPT4にプロンプトを入れてもうまく作れなかったスクリプトがoで入力すると簡単に作れたので、非常に便利になったのを実感できた。生成AIは繰り返し使っていかないと癖みたいなのまでわからないので、現状ではこの程度だが、今後もっと使ってわかってきたことは別途紹介していきたい。
ChatGPT4より確実に速い
私が生成AIに望む性能は速度と精度と処理数だ。今の生成AIを使えば使うほど感じるのはまずもっと速くなってほしい!ということだ。速くなればそれだけ確実に便利になるのは間違いない。そしてその性能がようやく近づいてきた。
結論から言うとo(オー)は、全てのプロンプトに対してデモのような0.何秒での即答はできない。しかし、ChatGPT4より高速になったのは間違いない、しかも高精度で高速なので大変嬉しいパワーアップだ。
ChatGPT4やAdobe Firefly、クロード、Gemini(有料のVertex AIなど含む)などで複雑なタスクや膨大なデータの処理をしてもらうと、それだけ時間がかかってしまうのがやはりストレスとなる。いずれスピードが早くなり一瞬で処理されるのだろうと思うものの、なかなか現実にはならない。それがデモでいずれ実現する範囲になってきたことが知れたのは嬉しかった。
サブスクリプションで月額20ドル
ChatGPTは無料でも使えるのだが、一定時間範囲での利用回数に強い制限があったり、全体の利用頻度の高さによってはアクセスできないことがある。そのため、安定して使いたい場合は「ChatGPT Plus」という月額サービスに加入する必要がある。価格は2024年5月現在では20ドル(日本円で約3,000円)。加入した場合は、今回のようなChatGPT4oのような新サービスを優先して使えるので便利だ。ただし使う用途が明確でない場合はまず無料で利用しまくって、利用用途が明確になってからの加入をお薦めしたい。
プラン一覧
詳しくはOpenAI公式ページへプラン | 説明 | 価格 |
---|---|---|
無料プラン |
|
$0 |
Plusプラン |
|
$20(ユーザー/月、毎月請求) |
Teamプラン |
|
|
Enterpriseプラン |
|
価格未定(営業担当に連絡) |
今は、OpenAIがかつてのAppleを彷彿させるほど熱い!
OpenAIの新発表は新しいプロダクトに魅力や勢いがある。かつてのスティーブ・ジョブズ率いるAppleがiMacからiPhoneなどの夢のプロダクトを次々と発表していた頃を彷彿させるかのように、OpenAIの新しいサービスには心をときめかされる何かがある。ジョブズのような魅了するプレゼンはなくとも、確かな未来を便利にするテクノロジーが生まれているのがヒシヒシと感じる。今回はChatGPT4のアップデートだったが、ChatGPT5が発表される時の世の中へのインパクトはこの程度では済まないだろう。
4コマ漫画や画像一覧、図解などで深い分析と学習が楽しめます。
野菜や果物から映画やゲームやサブカルまで、さまざまなトピックをカバーしています。
イラレブックの作者:1977年生まれ、大阪府出身。
2019年8月から自作のAdobe Illustrator製の画像で野菜から最新ゲームやアニメまで様々な情報の発信を開始しました。