【2024年6月】生成AIサービス比較:ChatGPTだけじゃない、Claude、Gemini、Perplexity AI、NotebookLMを体験レビュー

2024-06-23
2024-06-23

生成AIサービス比較の背景と目的

日々の業務に追われ、最新のAIサービスに触れる機会が少ないことが続いていました。しかし、先日話題になったClaude 3.5 Sonnetをきっかけに、ChatGPT以外のAIサービスも試してみることに決めました。この記事では、気になっていたAIサービスを実際に使ってみた感想と、それぞれの違いについて書いていきます。

対象とする生成AIは私が気になっていたというだけの理由で選ばれています。

Claude

Claudeは、Anthropic社が開発した大規模言語モデル(LLM)で、自然言語処理技術を利用して人間と自然な対話ができる生成AIです。 ChatGPTの競合にあたります。

Claudeの特徴は以下のと通りです。

  • GPT-4oより長いコンテキスト長。GPT-4oが12万に対し、20万のコンテキストウィンドウを持つ
  • マルチモーダル対応。画像もいける
  • 様々なファイル形式のアップロードに対応。エクセル以外は大体アップロードして読み込みが可能
  • 日本語の生成文章が流暢(主観)
  • モデルのバリエーション:
    • Opus: 最上位モデル、高度なタスクで最先端のパフォーマンス
    • Sonnet: インテリジェンスとスピードを両立
    • Haiku: 応答速度重視の最速・最小モデル

そして2024/6/21にClaude 3 Sonnetの進化版であるLLM「Claude 3.5 Sonnet」が公開されました。

Claude 3.5 Sonnetの進化

Claude 3.5 Sonnetを調べた結果です。

  • Claude 3 Opusよりも高い性能を発揮
  • 従来のClaude 3 Opusと比べて2倍の処理速度
  • コスト効率が高く、Opusの5分の1の価格で利用可能
  • コーディングや画像認識テストでOpusを上回る性能
  • より自然な文章生成能力
  • 新機能「Artifacts」の導入により、生成コンテンツのリアルタイム確認・編集が可能

なんといってもClaude 3.5 Sonnetに進化したことで、GPT-4oやGemini 1.5 Proなど他社の最新モデルと同等以上の能力を示したことが驚きです。

またコスト・処理速度も向上し、性能だけでなくユーザーの使いやすさも大幅に改善しています。

Claude 3.5 Sonnet のArtifacts機能を使ってみた

Claude 3.5 Sonnetで注目されたのが、コストや処理速度とともにArtifacts機能です。

Artifactsは、Claude 3.5 Sonnetが生成するコンテンツを専用のウィンドウに表示し、ユーザーがリアルタイムで編集・管理できる機能です。これにより、生成されたコンテンツを会話の文脈から独立して扱うことが可能になります。

以下が特徴です。

  • 独立したウィンドウ: Artifactsは、生成されたコンテンツをメインの会話ウィンドウとは別の専用ウィンドウに表示します。これにより、ユーザーはコンテンツを容易に編集・管理できます。
  • 多様なコンテンツ対応: Artifactsは、コードスニペット、文書、SVG画像、図表、Reactコンポーネントなど、さまざまな種類のコンテンツに対応しています。
  • バージョン管理: Artifactsは、編集履歴を保持し、異なるバージョン間を簡単に切り替えることができます。

無料版でも制限はありますが、試すことは可能です。

今回は簡単なQAシステムを作成してもらいました。生成AI機能を使って、回答の思考過程も記述するように依頼しました。質問部分は決め打ちの仕様になりましたが、要望通りのものを迅速に作成してくれました。画面のボタンも正常に動作し、コードの内容も非常にまともでした。素晴らしい機能です。

alt text

次に、スライドの生成も依頼してみました。

今回書いた文章をReveal.jsでスライドにしてもらうように依頼しました。見た目はそれっぽいものが生成されましたが、途中でエラーが発生し、動かなくなってしまいました。その後の修正もうまくいきませんでした。

しかし、簡単な数当てゲームなどは問題なく作成できました。このあたりはプロンプトや得意・不得意も関係しているのかもしれません。

Claudeを使ってみた感想

Claude初めて使いましたが無料版でも十分すぎるくらい文章生成能力が高いです。速度も高速。無料でClaude 3.5で使えるのはありがたいですね。画像とファイル入力も無料版で可能です。

また最新機能のArtifactsもすごいです。新しい生成AIのユーザー体験を提供しています。生成したものを高速かつ安定的に動かすことができています。

微妙なところはChatGPTよりインタフェースがわかりづらいところくらいです(自分がChatGPT慣れしてるというのもある)

Perplexity AI

Perplexity AIは、ユーザーの質問に対してインターネット上から情報を収集し、自然な文章で回答を生成する対話型AI検索エンジンです。いわば「インターネット検索版RAG(Retrieval-Augmented Generation)」と呼べるでしょう。

Perplexity AIの特徴

いちばんの特徴は検索だけじゃなくて検索意図を推測してあなたの知りたいことはこれですよね?と検索行動の一歩先を読んで情報のまとめと提示を行ってくれるところです。

  • 最新情報の提供:Webクロールを駆使して、最新の情報を提示
  • 情報源の明示:提供される回答には、その根拠となる情報源が明記される。これによりユーザーは情報の信頼性を確認しやすくなる
  • 情報の整理:調べた内容を自動で要約する機能を持っている。これにより長文の情報も簡潔に理解することができる

Perplexity AIを使ってみた感想

検索意図を推測して情報をまとめてくれるので便利だなーと思う反面、ソースを見ないと信頼できない内容のことも多く、結局ソースページを自分で検索して見ることも多々あり完全に効率的かどうかはあやしいです。

的確な検索ワードがパッと出てきて、アクセス先のサイトにもあたりがつけられる人はGoogleでもいいかもしれません。

特に自分の場合は公式ドキュメントの内容を理解したいことが多いのですが、Perplexityは意外と見に行ってくれず、ソースが2次情報だらけだとせっかく情報がまとまっていても信頼できません。 ただ概要レベルを把握するにはとても便利です。

有料版機能であるPro Searchは無料版でも制限ありで使えるのでこちらも試してみました。Pro Searchの場合は日本語で検索しても英語の情報も参照してくれることが多く、それらを日本語で出力してくれるのでこれは便利だなと思いました。

NotebookLM

NotebookLMは、Googleが開発したAIを活用したノートテイキングとリサーチアシスタントツールです。以下にその主な特徴と使用感をまとめます。

NotebookLMの特徴

裏側では後述するGemini 1.5 Proが利用さrているようです。

  • 情報の要約と整理は、ユーザーがアップロードしたドキュメントを基に、迅速に要約を生成し、重要なトピックや質問を提示します。これにより、情報の理解が深まり、効率的に学習やリサーチが進められます
  • 質問応答機能:アップロードした資料に基づいて、特定の質問に対する回答を生成します。例えば、科学論文の用語集を作成したり、歴史的な出来事の要約を提供したりすることができます
  • 多様なフォーマット対応ドキュメント、PDF、テキストファイル、ウェブサイトなど、さまざまな形式の資料を解析し、質問に回答できます

NotebookLMを使ってみた感想

論文の理解をするなどの用途にはすごくいいです!

ClaudeやChatGPTでも類似のことはできますが、NotebookLMでは情報とノートが主になっており、対話が主になっているChatGPTなどとは観点が違います。

うまく言語化できないですが、NotebookLMでは情報源が先にあってそれに付随するノートがあり、LLMによる対話はあくまで情報源の理解とノート作成の補助ツールとしての役割を持つイメージです。

Gemini

Geminiのアプリを使ってみました。

Geminiの特徴

  • 無料版でもマルチモーダル機能、高速かつ安定した文章生成能力を体験できる
  • Googleの各種サービスを拡張機能として利用できる。例えばYoutube、Gmail、Googleドライブなど
  • 有料版にするとGemini 1.5 Proが利用可能になる(無料版はGemini 1.0 Pro)。100万トークンの処理が可能
  • 有料版ではGoogle Oneのストレージ特典がつく

alt text

参考:Gemini Advanced

Geminiを使ってみた感想

基本的な機能は無料版でも十分に使える性能です。これはたまたまかもしれませんが、最新情報を取得し解答するクエリに関してはGeminiが優秀な印象を受けました。例えば、「Claudeでtool useは使える?」というクエリに対して、GPT-4oとClaude 3.5 Sonnetは使えないと回答しましたが、GeminiはAnthropicの公式ドキュメントを参照して最新情報を踏まえて正しく答えてくれました。

機能面では、ファイルアップロードができない点がChatGPTやClaudeの無料版と比較してやや不便です。

一方で、Googleの既存サービスとの連携が他のサービスにはない内容で非常に魅力的です。YouTubeのリンクだけで解説してくれたり、有料版ではGoogle Oneのストレージが付属するなど、他のサービスでは難しい機能が提供されています。

Gemini Advancedも試してみましたが、うーんという感じでした。個人的には無料版のGeminiの方が良かった感じがしました。Advancedになるとさきほどいいなと思ったWeb検索をなかなかしてくれず勝手に回答してばかりになりました。 (※ たまたまの可能性はあります)

ChatGPT, Claude, GeminiのAPI利用時の比較:料金と性能

調べた限り下記に挙げたモデルはTool呼び出し(Function Calling)にも対応しています。

また試したわけではないですが、GeminiとClaudeのFunction CallingはOpenAIと互換性がありそうです(Geminiはドキュメントに明記されています)

参考:

料金比較

perplexityにもAPIはありますが、ここでは割愛します。

ModelInput ($/1M tokens)Output ($/1M tokens)コンテキストウィンドウ備考
GPT-3.5 Turbo$0.50$1.50
GPT-4 Turbo$10.00$30.00
GPT-4o$5.00$15.012万
Gemini 1.5 Flash$0.35$1.05100万<= 128K Tokens
Gemini 1.5 Flash$0.70$2.10> 128K Tokens
Gemini 1.5 Pro$3.50$10.50200万<= 128K Tokens
Gemini 1.5 Pro$7.00$21.00> 128K Tokens
Claude 3 Haiku$0.25$1.2520万出力は4096トークン
Claude 3 Opus$15.00$75.0020万出力は4096トークン
Claude 3.5 Sonnet$3.00$15.0020万

比較サイトを見つけたのでみてみると、コスパではGemini Flashが一番良いです。性能を重視するならClaude 3.5 sonetも選択肢に入ります。

alt text

参考:https://artificialanalysis.ai/models/gemini-1-5-flash

比較してみると今からモデルを選ぶという段階であればgpt-4o以外も検討するべきとわかります。もちろん比較項目をわかりやすいものに限定してるので細かい項目でみるとまた違う結果になるとは思います。

普段使いのアプリとしての使い分け

※ 浅く使ってみた感想であることに注意

先端領域系の調べごとが多い人はGemini(無料版)を使うのはありです。

できれば検索して情報を確かめて欲しいクエリに対して、Geminiの動作は非常に優秀でした。例えば、「Geminiについて教えて」といったクエリに対しては、Geminiの公式サイトを参照して最新の情報を元に回答してくれるため、追加の操作なしで欲しい情報が手に入る感覚があります。

ClaudeやChatGPTは、プロンプトで検索して欲しいことを示唆しないと検索に行かないことが多いです。こういった用途はPerplexityの機能だと思うのですが、Perplexityは2次情報が多い印象でした。

ただし、有料版Geminiは無料版と挙動が違いました。なぜか有料版のGemini Advancedは検索を能動的にしてくれず、堂々と間違った内容を答えてきます。

次にプログラミングでデモアプリを作りたい場合や文章を綺麗に書きたい場合は、Claude 3.5が非常に優秀です。生成する日本語の流暢さもさることながらArtifacts機能は他のサービスにはない機能です。誰かに生成文書やデモ見せるならClaudeいいです。

NotebookLMは、特定の文書について理解を深めたり考えを整理したりする場合に有効です。これはチャットツールや検索ツールとは異なるユースケースです。

自分の使用頻度では無課金で十分なことが多いため、課金の必要性は感じません。

まとめると

  • チャット/検索(知りたいことの整理)にはGemini無料版
  • 論文や難解な文書の理解と整理にはNotebookLM
  • 簡易デモ作成や文章の整えにはClaude

が現状では最適だと考えています。

自分の場合は利用頻度や提供サービス内容的に上記サービスに関しては今のところ課金しなくてもOKという結論に至りました。

課金中のChatGPTは今のところ解約しなくてもいいかなと思ってます。使える機能、それぞれの精度、UI/UXなども含めて全体的な安定感はChatGPTのGPT-4oが良いです。 Gemini Advancedがより優秀になったら乗り換え検討します。

まとめ:生成AIサービスの多様性と可能性

ChatGPTが一強ではないことを改めて実感しました。モデルの生成能力やアプリのUI/UX、APIに関しても各社に良し悪しがあることがわかりました。

GeminiとClaudeが予想以上に強力でした。API利用についても、Gemini 1.5 Flashが圧倒的にコスパが良いです。

また、Claude 3.5のSonnetのArtifacts機能も非常に優れています。