Gemini 1.5 Proとadvancedの使い方|Geminiの良いところTOP5
4コマ漫画や記事一覧追加 by イラレブック Tweet

Googleから一度に100万トークン(約75万語、一般的な小説10冊分以上の文章量)を処理できる生成AIであるGemini 1.5 Proが発表された
2024年5月15日(水)にGoogle I/O 2024というGoogleのイベントでさまざまな新しいAIの発表がされた。
その中でも特に話題を呼んでいるのがGeminiの最新モデル Gemini 1.5 Proだ。
このモデルの最大の特徴は一度に処理できる量だ。なんと100万トークンも処理できる。これは約75万語、一般的な小説なら10冊分以上の文章量だし、百科事典数冊分に相当する。さらに今後200万トークンまで拡張するとのこと。これだけの量を一度に読み込めるなら、10冊の小説のデータを入れてこれらの登場人物が混ざった物語を作ってもらったり、その小説の中から感動するシーンだけ抜粋してもらうなんてこともできそうだ。とにかく凄そうなこのGemini 1.5 Proを実際使ってみて何が便利だったか?なにが良いか?ランキング形式で紹介していく。特にChatGPT4oと何が違うの?ChatGPT4oで十分でしょ?と思う人はGemini Proならではの特徴があるので是非確認してほしい。

Google スプレッドシートに書き出しできる
Geminiならではの特徴として画像から取り込んだ表データなどをそのままGoogle スプレッドシートに書き出せる機能があるのが便利。Gemini Proは画像認識機能も強化されたが、ここは最近発表されたChatGPT4oと比較するとだいぶ性能は落ちる。文字認識(OCR)として活用できなくはないが、一部は読み取れるものの、完全な読み込みは難しく誤った情報が読み取られることもある。


Bard時代から速度には信頼あり
Googleの生成AIであるBardは、2024年2月8日からGeminiという名称に変更された。Bard時代から速かったのでGeminiになってもその速度は健在だ。ただ最近はどのAIも高速化しており、GeminiやGemini Advance環境ではそこまでの差は無くなってきている印象だ。しかしVertex AIでGemini 1.5 Flashというモデルを選択するとその速度は顕著に上がる。高速に処理させたい場合にはとても便利だ。


将来的には最大200万トークンまで入出力が可能
なんと1度に最大100万トークンも入力できる。
100万トークンを文字数で考えると約75万語に相当、これは一般的な小説10冊分以上の文章量をGeminiに一度で読み込んでもらうことができるということなのだ。これこそがGemini 1.5 Proの最大の特徴でもある。ただし出力は、2024年5月現在では8192トークンが上限となっているので注意が必要だ。
それでもChatGPT4が1度に約4000トークンまでなので、その点から考えても多いことがわかる。


大量のデータを活かしたデータ分析
大量のデータを読み込める特性を活かして、データを大量に読み込ませた上でデータを分析してもらうと他の生成AIではできないようなことが可能になる。
こういう点ではとても便利だと感じた。例えば1000以上も行のあるエクセルやスプレッドシートの表データを読み込んでもらった上で、Geminiに処理をしてもらうことも可能なのだ。
他の生成AIでは分割して読み込ませるなどが必要なのに、そんな手間がなくなるのだからとても便利。ChatGPTでも大量のデータを分割して読み込ませて、その学習をもとに処理してもらうということもできるが、それが一括でできてしまうわけだ。
イラレブックでは様々な分野の情報分析を行なっており、例えばブルーロックやサイバーパンク2077、バルダーズゲート3、モータルコンバットなどはその一例だが、このような莫大な情報量を誇るアニメやゲームなどを分けて管理したり、混ぜて分析するにはこのGemini Proがとても活躍してくれる。具体的にどこが便利か?など実際の活用事例などは別途紹介したいと思う。


生成AI界最強のスクリプト能力
Gemini ProはChatGPTに比べてスクリプトだけは精度が高い。
Gemini Proの最大出力トークンが8,192なので、ChatGPT4の倍程度の出力が可能なこともあり、最初のベースとなるコードを書いてもらうなら現状一番使えるのがこのGemini 1.5 Proだ。
ChatGPT4では、4000トークンを超えても追加みたいなことができるので実質それ以上のコードも書けるのだが、一度で出力できる量に差があるために精度が生まれているのかもしれない。そのためChatGPT4oは、スクリプト修正に使うのが現状最適のように感じる。そのため、AIでゲームを作るならGemini 1.5 Proでベースコードを書いてもらい、細かいニュアンスも理解できるChatGPT4oで修正していくのが一番作りやすく感じる。
ちなみに筆者がGeminiとChatGPTを使い暇潰しのために作ったゲームが簡単に作れたのがこのCEOゲーム。グラフの一番大きいところをタップするだけで収益1兆円を目指すゲームだ。
イラレブックでは1日で1記事を作り続けてきているが、そういう意味でも1日でプログラム知識も必要なくゲームが簡単に作れてしまうのはAIの凄いところ。
またAIでのゲームの簡単な作り方もわかってきたので別の機会で詳しく紹介したいと思う。
そんなわけで現状でも一番完成度の高いスクリプトを作ることができるのがこのGemini 1.5 Proだ。


Gemini Advancedはサブスクリプションで月額2900円
Geminiは無料でも使えるのだが、100万トークン入力できるGemini 1.5 Proを使いたいなら有料サービスに加入する必要がある。価格は2024年5月現在では2900円。これに加入することでGeminiからGemini Advancedが選べるようになる。
時期によっては無料や割引サービスも行なっている。2024年5月だと最初の2ヶ月間は割引サービスが入り1450円で利用できる。最初の2ヶ月の間で利用しまくって、利用用途が明確になってからの継続をお薦めしたい。詳しくはこちら(Google公式サイト)。
ちなみにVertex AIやGoogle AI Studioで利用したい場合は、料金プランが利用状況に応じて異なるようになっている。最新の価格情報については、変更される可能性があるのでこちらのGoogle Cloudのウェブサイトで確認してほしい。
GoogleのGeminiで少しややこしいのが、無料版(Gemini)、有料の月額課金版(Gemini Advanced)と従量課金版(Vertex AI)の3つがあることだろう。
誰でも使いやすいのはGeminiとGemini Advancedだが、プログラミングなどの精度が高いのはVertex AIだ。特にVertex AIの使い方は少しややこしいので、別の記事で説明したいと思う。

とにかく膨大なデータの分析とプログラミングがGemini 1.5 Proの最大の強みだ。
200万トークンは今後のことで、100万トークンは入力。出力は現状まだ。
ここで気をつけたいのが、Gemini 1.5 Proは最大合計トークン(入力と出力)100万となっているが、現状は最大出力トークンは8,192である。入力は100万トークンまでできても、いきなり100万トークンを超えるスクリプトを出力できるわけではない点だ。100万以上のトークンも出力できるなら、複雑なスクリプトもスイスイ作れる!と思ってVertex AIに飛び込んだが、最大出力トークンは8,192のままでそこは拡張されていなかった。今後拡張されるとは思うが、2024年5月18日の段階ではまだできないので注意が必要だ。
ちなみに少量のデータでの分析はChatGPT4oの方が精度が高いが、情報量を上げていくと共に利便性が大幅に上がってくるのがGemini 1.5 Proの特徴とも言えるだろう。「読むの面倒だから触ってないけど、凄いデータ量のテキストデータがあるんだよな」というような人なら、プロンプト次第で夢のような生成AIとなるだろう。
4コマ漫画や画像一覧、図解などで深い分析と学習が楽しめます。
野菜や果物から映画やゲームやサブカルまで、さまざまなトピックをカバーしています。
イラレブックの作者:1977年生まれ、大阪府出身。
2019年8月から自作のAdobe Illustrator製の画像で野菜から最新ゲームやアニメまで様々な情報の発信を開始しました。
