前回の記事では生成AIが流行っている理由について筆者なりに考えてみました。
前回の記事についてはこちらからご確認ください。
前回の記事ではGeminiとChatGPTはどちらも無料で、画像生成や文章作成など、様々な用途で使える生成AIだとしましたが、どちらもそれぞれの特徴があるはずなので、今回の記事ではGeminiとChatGPTについて同じ内容を指示し、比較してみたいと思います。
GeminiとChatGPTの共通点と特徴
比較するうえで最初にGeminiとChatGPTの共通点と特徴を見ていこうかと思います。
共通点
どちらも大量のデータを学習した高性能な言語モデル(LLM)を基盤とし、人間のような自然な文章の生成や対話が可能です。テキストだけでなく、画像、音声、コード(プログラミング)などを理解し、生成可能です。チャット形式で質問や指示を出し、高速で回答を得られます。また、どちらもiPhoneやAndroidの専用アプリ、Webブラウザから場所を選ばずに、基本無料で利用することができます。
それぞれの特徴
Gemini
GeminiはGoogleが開発した生成AIのため、GmailやGoogleカレンダーといったGoogleサービスとの連携が特徴です。また、Google検索と連携して最新情報を反映できるため、ニュースや制度改正などの変化の速い情報に強い点が大きな特徴となります。次に、マルチモーダル対応が可能で、画像データの読み取りや図表を含む資料整理に活用可能です。加えて、法人向けにも拡張されており、情報管理やセキュリティの面での配慮が進んでいます。組織単位での管理機能が用意され、業務利用に適した環境の構築が可能です。
ChatGPT
ChatGPTはOpenAIが開発した対話型AIです。言語理解と生成の両面で高い柔軟性を持ち、自然な会話形式で利用できるため、質問に対して追加の深堀や別視点の回答を依頼しやすい点が強みです。また、長文処理や要約に強く、複雑な文書を整理して読みやすく提示できます。さらに多言語対応が可能なため、外国人とのコミュニケーションや外国語での資料作成や共有にも応用ができます。また、セキュリティ面でも法人向けプランが利用されているため、情報管理に配慮した環境でも利用可能です。
以上のようにGeminiとChatGPTには、共通点とそれぞれの強みがあるとわかりました。次からはGeminiとChatGPTを実際に使ってみて比較をしてみます。
GeminiとChatGPTの比較
ここからはGeminiとChatGPTの比較をしていきたいと思います。
1.長文処理と要約
今回、要約には「第3次AIブーム」を使い比較していきます。
まず、Geminiで要約してと指示を出したところ5秒ほどで下記のようになりました。こちらは段落がついていたり、太文字・細文字を使い分けていたりととても見やすくなっております。
次はChatGPTで同じ文章を要約してと指示を出した結果、下記の通りになりました。こちらはすべて細文字で構成されており、筆者の指示通り要約したと感じます。
この2つを比べると、どちらも筆者の指示通り要約できていますが、文章の見やすさ、内容の詳細の理解のしやすさにおいてはGeminiのほうが優れているなと筆者は感じました。
2.画像生成
次は、画像生成面で比べてみたいと思います。生成する画像に関しては、誰でもわかるかつ筆者が好きな柴犬を生成してみようかと思います。
まず、Geminiで「柴犬の画像作って」と指示したところ下記左の画像が生成されました。こちらは15秒ほどで生成されました。右下にGeminiで作ったというマークがあるため、生成AIを使ったものだとわかりますが、こちらのマークが隠されていると正直に言って筆者はAIだと見分けることはできかねると思います。また、「寝転がっている感じにして」と指示を出したら、下記右の画像が生成されました。こちらも違和感なく生成されています。このどちらの画像も柴犬にピントが合っていて、奥にある木等にはピントが合っていないのも実際の写真のように見える要因なのかなと筆者は思いました。

次にChatGPTで同様に「柴犬の画像作って」と指示を出したら下記左のような画像ができました。同様に「寝ころんだ感じにして」と指示を出したら、下記右の画像が生成されました。こちらも15秒ほどで生成されました。こちらも先ほどと同じで言われなかったら生成AIが創った画像と見分けるのは難しいです。こちらもGeminiと同じく背景はピントが合っていなく本当の写真のように見えます。

この2つを比べてみると、どちらも「~して」という簡単な指示でまるで写真のような画像を生成しているところから何か言葉では表せない凄さを筆者は感じます。また、どちらとも「柴犬の画像作って」と指示しただけで、草木があったり、人がいたりと背景も凝っている点があり、単純な画像生成だけでなく、よりリアルに近づけようとしていることがうかがえます。
3.プログラミングコードの作成
最後にプログラミングコードの作成で比較してみようと思います。指示内容につきましてはただ単に「プログラミングコード書いて」と指示を出しました。
まずGeminiで指示を出したところ、下記のような回答が出ました。
「プログラミングコードを書いて」とのことですね!承諾しました。
ただ、ひと口に「コード」と言っても、作りたいものによって使う言語や内容は全く変わってきます。まずは、あなたが「何をしたいか」に合わせて、いくつか定番のサンプルを用意しました。
1. Webサイトに動きをつけたい (JavaScript)
ボタンを押すとメッセージが変わる、最も基本的なプログラムです。
JavaScript
// ボタンをクリックした時の動作
function sayHello() {
const message = "こんにちは!プログラミングの世界へようこそ。";
console.log(message); // ブラウザのコンソールに表示
alert(message); // 画面にポップアップ表示
}
2. データの集計やAIに興味がある (Python)
リストの中にある数字の平均値を計算する、シンプルで強力なコードです。
Python
# 数字のリスト
numbers = [10, 20, 30, 40, 50]
# 合計を個数で割って平均を出す
average = sum(numbers) / len(numbers)
print(f"データの平均値は {average} です。")
3. 見た目を作りたい (HTML/CSS)
ブラウザで表示される「赤い大きな文字」を作るためのコードです。
HTML
<!-- HTML部 -->
<h1 class="title">ハローワールド!</h1>
<!-- CSS部 -->
<style>
.title {
color: red;
font-size: 48px;
text-align: center;
}
</style>
「これを機に何か作ってみたい」のか、あるいは「特定の言語でエラーが出て困っている」のか、今の状況を教えてもらえますか?
とGeminiではこのようになりました。「プログラミングコードを書いて」との単純な指示で様々な分野にあった言語の定番のサンプルが用意されました。
次にChatGPTで同様に「プログラミングコード書いて」と指示を出したところ下記のようになりました。
このように出ました。しかしこの後に、「PythonでAI・機械学習について書いて」と指示したら下記のようになりました。
ChatGPTでは言語と作りたいものを入力すれば、このように詳細にコードが出力されました。
Geminiでも同様にPythonでAIについてコードを書いてと指示したら詳細にコードが書かれました。この結果からGemini、ChatGPTのどちらともプログラミングコードの作成が可能だとわかります。また、どちらも指示を詳細にしていけばさらに本格的に分野に沿ったプログラミングが可能のようですので、また別の機会に触れてみたいと思います。
まとめ
今回の記事では生成AIとして代表的なGeminiとChatGPTの比較についてまとめました。
今回の記事のポイントは次の通りです。
・どちらも大規模言語モデル(LLM)を基盤とした、チャット形式で質問・指示を出せ、画像作成、文章要約、プログラミングコードの作成等を短時間で行うことが可能。
・長文処理・要約の面ではGeminiは見出しを作ったりと、見やすい文章を作っていたが、どちらも素早く要約できていた。
・画像生成の面ではどちらも写真と見分けがつかないほどの画像が短時間で生成された。
・プログラミングコード生成の面ではどちらも指示を詳細にしていくほどに、より専門的なコードを書けるようになる。
今回、GeminiとChatGPTについて比較してみましたが、どちらも短時間で指示通りの作業を高精度でこなすのが可能です。
特に画像生成では背景のピントがぼけていたり、人が写っていたり、花などのきれいな背景であったりと単純に指示を出したもの単体の画像ではなく、より写真に近い画像を生成しようとしているのが、Gemini、ChatGPTのどちらにも共通していると考えられます。先にも述べましたが、写真と見分けがつかないほどのレベルの画像を生成するので、こちらの技術を悪用する人もいるだろうと感じました。また、画像生成では知識があっても見分けることは非常に難しいので、画像だけを見て決めつけるのではなく自分自身で調べてファクトチェックすることも重要だと感じました。
また、プログラミングコードの生成では大枠は作ってくれますが、プログラミングに対して知識がない場合は生成AIが作成したコードがエラーを起こした場合にエラー箇所を見つけることはできないので、こちらはまだ生成AIにすべてを任せることはできないかと思います。
今、スマートフォン・パソコンを持っている人は気軽にGemini、ChatGPTを使うことが可能です。今回は簡単な指示による生成AIの比較でしたが、より指示を詳細に出すことで、さらに生成AIの性能を引き出すことが可能です。プロンプトエンジニアリングという生成AIから意図したとおりの高精度な回答を引き出すために、入力する指示文を設計・最適化する技術もあるように、生成AIの可能性は無限大ですし、扱う人間の知識によって生成可能なものの幅も広がりますので、人間がAIに頼りきるのではなく、知識習得のために生成AIを使うなど、AIを利用することで人間もAIも進化するということが重要なのだと筆者は感じました。
参考文献
【ChatGPTとGeminiを比較】特徴やおすすめの活用シーンを紹介
https://biz.moneyforward.com/ai/basic/246/
コメント