GPT1から4.1までモデル一覧を一挙公開
このエントリーをはてなブックマークに追加

当ページには一部広告が含まれます。 活用法

【ChatGPTモデル一覧】GPT-1から最新GPT-4.1まで時系列順に勉強!

2025年4月、ChatGPT-4.1がリリースされました。

が…。モデルの変化が著しく、正直付いていけていない方も多いのではないでしょうか。

本記事ではそんな方に向けて、これまでにリリースされたGPTのモデルを、一度時系列順に整理してみました。

初心者の方でも親しめる様に、難しい専門用語などもできるだけ嚙み砕いて説明しますので、ぜひ参考にしてみてください。

最新の「GPT4.1」に関する情報は?

簡潔にまとめております。最新情報だけ気になる方はこちらをご確認ください。

Contents

ChatGPTの概要

GPT-1から、o3 miniまでの流れについて

2022年にいきなり現れ、AI関連の話題をかっさらっていったかの様にみえるChatGPT

じつは2018年頃のGPT-1のリリースからコツコツと技術力を高め、満を持してChatGPTに至った背景があります。

2018年、GPT-1をリリース

GPTの原型は、2017年にGoogleが提唱した、より高精度に「人間の脳」を模したしくみ=Transformerまで遡ります。

この「Transformer」を原型にして、2018年には文章生成(理解)がメインの、GPT-1がリリースされました。

Transformerは、GPT以外にも、GoogleのBERT、Meta社のRoBERTaなど、さまざまな派生モデルが登場するきっかけとなりました。

GPTは何の略?

GPTは、Generative Pre-Trained Transformerの略です。

意訳すると「(文章などの)生成(を行う)、(テキストなどで)事前学習(を行った)、Transformerといったところです。

この様な人間の脳を模したしくみは、「ニューラルネットワーク」ともよばれています

2022年、ChatGPTとして正式リリース

2018年にGPT-1としてリリースされたGPTは、年ごとにGPT-2、GPT-3と順調に進化を続けます。

そして、2022年11月に、GPT-3の強化版「InstructGPT」をベースに、"会話型"モデル「”Chat”GPT」を発表。

2023年3月に発表されたGPT-3.5を搭載することで、よりスムーズな対話も可能になりました。

InstructGPTってなに?

人間からのフィードバックも学習(RLHF)し、より自然で適切な応答が可能になったGPTです。

指示(プロンプト)に対する回答精度が向上し、誤情報や不適切な回答が減少しました。

ChatGPTは2022年11月のリリース直後から爆発的に普及し、数カ月で1億ユーザーを突破。 AIとの自然な会話は一気に広まりました

GPTは計算に弱い?

冒頭で「文章生成(理解)がメイン」と記載しましたが、じつはGPTは計算があまり得意ではありません。

今あるAIは万能ではなく、目的が異なる分野では十分に力を発揮できないからです(≒フリーランチ定理)。

理数分野の弱点を解消するために、現在開発が進められているのが「GPT」シリーズとは別枠の「OpenAI」シリーズです。

だから「自動運転AI」や「画像生成AI」みたいに、様々な分野のAIに分かれているんだね!


モデルの違いを時系列で追ってみよう|GPTシリーズ

モデル名 できるようになったこと
2018年6月 GPT-1 AIが文章を作ることができるようになった
2019年2月 GPT-2 より長く、自然な文章が作れるようになった
2020年6月 GPT-3 より賢くなり、質問への答えが正確になった
2022年11月 GPT-3.5 AIとの会話がスムーズになり、使いやすくなった
2023年3月 GPT-3.5 Turbo 3.5を高速&低コスト化。主に長文の理解力が向上した
2023年3月 GPT-4 さらに正確で、複雑な質問にも答えられるようになった
2024年5月 GPT-4 Turbo 4を高速&低コスト化。主に長文の理解力が向上した
2024年5月 GPT-4o 文章だけでなく、画像や音声も理解できるようになった
2024年7月 GPT-4o Mini 4oの軽量版として、無料会員にも一般公開
2025年2月  GPT-4.5 回答の精度が向上、理数分野も強化(※現在は有料会員限定)
2025年4月 ←NEW GPT-4.1 (Mini, nano) より長い文章を扱う能力、より新しい知識など。基本、開発者用。

 

「あれ?o3 miniとかなかった?」と思った方もいらっしゃるかもしれません。

「o~シリーズ=OpenAIシリーズ」に関しては、先述した通り「GPTシリーズ」とは別枠で進歩しています。

oシリーズは後述するとして、まずはGPT誕生から、現在の主流「4o」と、最新の「4.1」までの軌跡を説明していきます。

「4o(omni)」と「o3」は同じ「o」が付いていますが、全くの別物です

1. GPT-1(2018年)

特徴

  • モデル名: GPT-1
  • パラメータ数: 約1.17億
  • トレーニングデータ: 数千冊の書籍

開発当初の段階では、「質問に答えるAI」ではなく、文章をより自然に理解し、作るためのAIとして開発されました。

AIが単語や文章のパターンを学習し、滑らかな文章を作れるようになり、効率的に文脈を理解できるようになったのが特徴です。

この様な性質から、主に小説・記事・文章の補完などの用途で活用されました。

【豆知識】パラメータ数ってなに…?

パラメータ数とは、AIが「どれだけのことを学習しているか」を表す指標のひとつです。

単純に、パラメータ数が多いほど、より賢く、より複雑なことを考えられるイメージです。

2. GPT-2(2019年)

特徴

  • モデル名: GPT-2
  • パラメータ数: 最大15億
  • トレーニングデータ: インターネット上の大規模テキストデータ

GPT-2は、短い文だけでなく、ストーリーや記事などの長文を自然に作成できるようになったのが特徴です。

大小4種類のパラメーター数で開発されましたが、悪用リスク(フェイクニュースなど)が懸念され、最大モデルは暫く後に公開されました。

この段階ではまだ「会話型AI」ではありませんが、指示文(プロンプト)を工夫することで簡単なやりとりができるようになりました。

【豆知識】トレーニングデータってなに…?

トレーニングデータは、AIが学習するための膨大なテキストや画像などの情報データです。

GPTは、インターネット上の公開データ(書籍・論文・ニュース・ウェブサイト・他)などから、事前に学習して作られています。

3. GPT-3(2020年)

特徴

  • モデル名: GPT-3
  • パラメータ数: 最大1750億
  • トレーニングデータ: Wikipedia、書籍、コードなど幅広いデータなど

GPT-3は、パラメータ数が1750億(GPT-2の約100倍)に拡大し、遂に人間のような自然な会話ができるようになりました。

事前に学習していなくても、少しの例を見せるだけで対応できる「柔軟性」が向上したのも特徴です。

また、開発者向けにGPT-3のAPI(※接点)が提供され、AIを組み込んだアプリやサービスが急増。用途が一気に拡大しました。

それと同時に、「会話が進むと矛盾が出る」、「ハルシネーション」といった問題点も表面化してきます。

【豆知識】ハルシネーションってなに…?

直訳で「幻覚」を表し、AIが事実ではない情報をあたかも本当のように生成する現象のことです。

AIが学習データの範囲外の情報を補完しようとする際に発生しやすくなり、「AIの嘘」とも称されます。

現在は大幅な改善はみられるものの、ゼロになった訳ではないため、人力による最終チェックは必ず必要です

4. GPT-3.5(2022年)

特徴

  • モデル: GPT-3.5
  • パラメータ数: 非公開(推定3000億前後)
  • 会話できるAIとして広く知れ渡った原点に

GPT-3.5は、会話特化型のAIとして開発され、より自然で安全な対話ができるようになったモデルです。

InstructGPTや、RLHF(人間のフィードバック学習)などの会話の質にフォーカスした機能を導入し、回答の質が向上しました。

また、「ChatGPT」として無料提供された事で爆発的に話題性が向上。多くのユーザーの目に留まる事になりました。

5. GPT-3.5 Turbo(2023年3月)

特徴

  • モデル: GPT-3.5 Turbo(ターボ)
  • パラメータ数: 非公開
  • GPT-3.5の高速&低コスト化に成功

GPT-3.5と比べて、処理速度が速く、運用コストも削減したモデルです。

そのため、無料ユーザー向けにも安定した提供が可能になりました。

長らく無料で使えるGPTとして親しまれてきた標準モデルでしたが、現在ではGPT4o-Miniにその座を譲りました。

6. ChatGPT-4(2023年3月)

特徴

  • モデル: GPT-4
  • パラメータ数: 非公開
  • 画像理解や、長文理解力の向上

GPT-4は、テキストだけでなく、画像も理解できるAI(※マルチモーダル)として進化し、より正確で賢くなりました。

AIが処理できるトークン数がGPT-3.5の約4,000から約9倍にまで拡大し、長い会話や、大量のテキストを扱う能力が向上しています。

また、ハルシネーションの減少により、知識の正確さが重要な場面(医療・法律・教育など)でより信頼できる回答が可能になりました。

【豆知識】トークンってなに…?

AIが文章を処理するときの最小単位(単語や文字のかたまり)のことです。

日本語の場合、ひらがなは1文字1-2トークン、漢字など画数が多い場合は更に多くのトークン数を要します。

処理できるトークン数を超えると、「使用制限に達しました」のメッセージと共に、数時間使用できなくなります。

7. ChatGPT-4 Turbo(2023年11月)

特徴

  • モデル: GPT-4 Turbo(ターボ)
  • パラメータ数: 非公開
  • GPT-4の高速&低コスト化に成功

GPT-4 Turboは、より高速&低コストをテーマにしつつ、長文の理解力も大幅に向上したGPT-4の改良版です。

文字数制限の基準となる、トークン数がGPT-4と比較して更に3倍程度向上し、より多くのテキストを扱える様になりました。

また、難しい問題も解けるようになり、コード生成、数学の問題、物語の創作など、幅広い分野で活躍を見せ始めます。

8. GPT-4o(2024年5月)

特徴

  • モデル名: GPT-4o(オムニ)
  • パラメータ数: 非公開
  • 画像認識に加え、音声認識が可能に

GPT-4oは4-turboに似通っていますが、テキストや画像に加え、音声まで統合的に処理できる「マルチモーダルAI」として正統進化しました。

リアルタイムでの音声認識や応答が可能になり、使用シーンがさらに拡大したのが特徴です。

また、4-turboと比較して速度面でもコスト面でも向上しています。

9. GPT-4o Mini(2024年7月)

特徴

  • モデル名: GPT-4o Mini(ミニ)
  • パラメータ数: 非公開
  • 無料で使用できる4シリーズ。2025年初頭現在の標準モデル。

GPT-4o Miniは、GPT-4oの軽量版として登場しました。

4oには性能面で劣りますが、大きな特徴は「無料で使用できる」点。

ついに無料でもGPT-4シリーズの性能を体験できるようになり、GPT3.5の後継として今現在多くのユーザーに親しまれているモデルです。

10. GPT-4.5(2025年2月)

特徴

  • モデル名: GPT-4.5
  • より汎用性がアップし、回答の精度も向上

画像や文章を使った問題を解く能力(マルチモーダル)に対応しながらも、STEM分野(理数系)にも中々強い汎用モデルです。

2025年3月現在、有料会員にのみ公開されています。

GPT-4.5の詳細は、本稿最後で比較表などを用いながら解説していきます

11. GPT-4.1(2025年4月)

特徴

  • モデル名: GPT-4.1
  • 一定の分野で高い能力向上。ただし、API専用。

「コーディング」、「指示遵守」、「より長い文章や複雑な会話」

主に、この3点において飛躍的な向上が見られるのがGPT-4.1です。

また、2024年6月時点での学習データを用いており、より時流に即した回答が可能です。

ただし、以下公式からのアナウンスの通り、普段使いのアプリやブラウザでは現在使用できません。

Note that GPT‑4.1 will only be available via the API.

訳:GPT-4.1はAPI経由でのみ利用可能となることにご注意ください。

引用:OpenAI (2025年4月14日)

APIというのはざっくり言えば…

APIとAI

ChatGPT → 企業が都度使用料払う → 独自カスタマイズ → 別サービスとして提供

つまり、GPT(OpenAI)に使用料を払う形で、自社AIがなくても間借りしてサービス開発できるイメージです。

おもに開発者向けに提供されており、残念ながら私の様な一般ユーザーにはあまり縁がありません……。

GPTを利用しているサービス関連は、より高品質になる事が想定されます


派生進化した、o(Open AI)シリーズ

openAI oシリーズの性能比較図
引用:OpenAI
モデル名 できるようになったこと
2024年 o1-preview 数学やプログラミングなど、難しい問題に強くなった
2024年 o1-mini o1-previewを軽くして、より速く動くようにした
2025年 o3-mini o1-miniよりももっと速く、もっと賢くなった

GPTの正統進化とは別枠で発展しているのが、数字の前に「o」の文字を冠した「oシリーズ」です。

「ChatGPT oシリーズ」ではなく、「OpenAI oシリーズ」を正式名称としている事からも、文系のGPTとは別枠であることがうかがえます。

oシリーズは「AIがより深く考えるためのモデル=推論モデル」として、GPTとは異なる方向性で発展しています。

広く「ChatGPT o1」と誤認されている上、「4o」というモデルがあるため、認識をややこしくしています

1. o1シリーズ(2024年9月)

特徴

  • モデル名: o1-preview、o1-mini
  • ChatGPTシリーズと比べ、推論能力が強化されている

o1 thinks before it answers—it can produce a long internal chain of thought before responding to the user.

"o1 は答える前に考えます。つまり、ユーザーに応答する前に、思考の長い連鎖を生み出すことができます。"

引用:Open AI  2024年年9月12日

o1は、高度な推論能力を備え、とくにSTEM分野(科学、技術、工学、数学)などの複雑なタスクに特化しています。

コーディングや数式などを扱うエンジニアの方々に恩恵がありますが、逆に日常使いでは推論の時間が増す分、有用性が下がる一面も。

また、o1-miniはスペックが高くないPCなど、リソースが限られた環境でも快適に動作する様に作られたモデルです。

【豆知識】推論ってなに…?

推論(すいろん)とは、すでにある情報をもとに、新しい結論を導き出すことです。

考えたり、予測したりする過程のことを指します。

2. o3シリーズ(2025年1月)

特徴

  • モデル名:o3-mini
  • o1に比べ、更に推論能力を強化

o3-mini with medium reasoning effort matches o1’s performance in math, coding, and science, while delivering faster responses. 

"o3-miniは中程度の推論努力で、数学、コーディング、科学の分野で o1 のパフォーマンスに匹敵し、より高速な応答を実現します。”

引用:Open AI  2025年1月31日

o3は、o1の高い推論能力を継承しつつ、高速性とコスト効率を向上させたモデルです。

何か新しいことができる様になったというよりは、引き続きSTEM(科学、技術、工学、数学)分野でのタスクに重点を置いて改良されたモデルです。

無料ユーザーにも制限付きで提供されている事から、注目が集まっています。

「o2」に関しては、既に商標権が取得されていたため、「o2」の名称で公開できなかったとされています


有料版との違い|現在利用できるモデルは?

2025年2月現在、各プランのユーザーがどのモデルにアクセスできるかを、表にして記載しておきます。

前述したモデル別解説と併せて、お役立てください。

プラン 月額料金 主な特徴
無料プラン 無料 ・標準で「GPT-4o Mini」を使用可能
・「GPT-4o」への制限付きアクセスあり
・音声チャット、GPTsなどの基本機能利用可
Plusプラン $20/月 ・「GPT-4o」の使用制限が引き上げられる
・画像生成機能が利用可能
・高度な音声入力、動画入力に対応
・Soraを用いた動画生成が可能
Proプラン $200/月 ・Plusプランの全機能を含む
・o1, o1-mini, GPT-4oの制限撤廃
・o1 Proモードにアクセス可能
・Soraを用いた動画生成の拡張機能利用可
・プロ向けの高度なAI活用が可能

無料ユーザーは?

標準で使えるのは「GPT-4o mini」および、「GPT-4oへの制限付きアクセス」のみとなります。

音声チャットや、ChatGPTを自分好みにカスタマイズできる「GPTs」など一通りの機能は使用できます。

日常でちょっとAIを使ってみたい、とりあえず試してみたい、そんな方はまずは無料プランで十分です。

Plusプラン(月額20ドル)

画像生成や、高度なやりとり、GPT-4oでのやりとりの制限が引き上げられます。

また、気分を察知するといった「高度な音声入力」や、動画入力についてのアクセスが可能に。

他にも、最新のGPT4.5(お試し程度ですが…)や、soraを用いた動画生成など、新機能に一早くありつけるのもメリットです。

>>動画生成AI「sora」についての解説はこちら

Proプラン(月額200ドル)

Plusのすべての機能に加え、o1, o1-mini, GPT-4o、高度な音声入力の制限が撤廃されます。

また、より高度な問題に対して最適な回答が得られる「o1 Proモード」にアクセスできる他、soraを通じた動画生成の拡張性が向上します。

まさに「プロ」向けのプランであり、AIを本格的に仕事で用いたい場合に有用なプランです。

ChatGPTはどこから利用できる?

こちらのページが、OpenAI直下のChatGPT公式サイトになります。

飛び先の「今すぐ始める」を選択するとブラウザ版で、「アプリをダウンロードする」を選択するとデスクトップアプリ版で開始できます。

ブラウザ版(※とくにChrome)は気軽に起動できる強みがありますが、アップデート直後など、挙動がおかしくなる事が多々あります。

環境に合わせて使用してみてください。

スマートフォンの方は、アプリストアからダウンロード可能です。類似アプリにご注意ください

今後の展望|AIエージェント

AIエージェントについてのイメージ像

AIエージェントとは、単なるチャットボットや質問応答AIとは異なり、ユーザーの代わりにタスクを実行し、より自律的に動作するAI のことを指します。

推論能力が発達してきた事により、「与えられた指示に回答を返すだけ」のAIから脱却する研究が進められています。

ビジネスシーンでの今後

例えば…

・メールの自動送信や自動返信(特定の条件に応じてメールを処理)

・会議のスケジュール管理(関係者の空き時間を調整し、自動で予約)

・レポート作成・データ分析(売上データを元に、AIが自動でレポートを作成)

このように、AIエージェントは、社内業務の自動化に貢献することが予想されます。

個人アシスタントとしての今後

例えば…

・日常のタスク管理(ToDoリストの自動作成・リマインダー設定)

・オンラインショッピングの最適化(価格比較をして最安値で購入)

・旅行プランの自動作成(フライトやホテルの予約を最適化)

Googleが開発した「Gemini」に関しては、早くもGoogleカレンダーやGmailとの連携がスタートしています。

Gmailに届いた飲み会の予定をGoogleカレンダーに登録してもらうなど、対話に留まらない使い方が始まっています。

生成AIについてもっと学びたい場合は?

GeminiとかPerplexityとか、いろんなAIがあるみたいだけど…

中国発祥の「Deepseek」の話題でも持ち切りですが、とにかく進化の著しいAI。

ChatGPTの様な「LLM」とよばれるモデルだけでも、Gemini、Perplexity、Genspark…など、挙げればキリがありません。

「AIを学ぼう!」と思って書籍を買ってもイマイチ情報効率が悪い…そんな方に向けて、オススメの「情報の仕入れ方」について掲載しておきます。

1.講座やスクール、セミナーから情報収集

生成AIをスクールや講座で学ぶ

より実践的に学びたいのであれば、「ビジュアル」や「手を動かす」といったプロセスを踏める講座やスクール。

そして、質疑応答などがリアルタイムで可能な、”無料セミナー”がおすすめです。

中には悪質なセミナーもありますので、信頼できる主催元のセミナーのみ掲載します

講座を視聴する

昨今ではUdemyやYoutubeなど、安価(※または無料)でも質の高い講座が簡単に受講できる様になりました。

どちらも一長一短ですが、Udemyの場合は情報更新するとカリキュラム全体に歪みが発生するため、どうしても最新情報への対応が遅れがちな印象です。

Udemyでは体系的に基礎を学び、ある程度理解した段階で、Youtubeで新しい情報を追うのがオススメです。

スクールに通う

UdemyやYoutubeなどの講座や書籍に通じて言えるのは、「受動的な学び」がメインになるという点です。

実際に手を動かして、より実践に即した学習をしたいなら,スクールに通うのは非常に効率的な学びになります。

セミナーに参加する

動画の場合は「分かりやすいと思ったら更新が1年前だった…」なんて事になると、折角インプットした知識が無駄骨になる可能性も。

効率的に、網羅的に、そして最新の情報を手っ取り早く仕入れ、質疑応答もできる。そんなセミナーへの参加は非常にお手軽でおすすめです。

以下はXフォロワー数10万人を超える、木内翔太さんが主催する「SHIFT AI」の無料セミナーの一例です。

引用:SHIFT AI

セミナーは、AIの入門や今後のキャリアへの活かし方をはじめとした、初心者でもとっつきやすい内容で展開されています。

また、参加後はAIへの質問の仕方(プロンプト)や、活かし方など、大ボリュームの限定講義が無料でプレゼントされます。

ChatGPTプロンプト集52選ChatGPT完全ガイド 動画講義
AIキャリア形成ロードマップChatGPT大全
GPTs 55選生成AIコンサル キャリア形成ロードマップ
プロンプト設計解説動画講義AIキャリア診断
AI時代の働き方解説専門家6名による徹底討論動画

とくにグイグイ営業される訳でもありませんので、休日など時間があるときに参加を検討してみては如何でしょうか。

\豪華10大プレゼント付き/

SHIFT AIの無料セミナー

2.AIの勉強ついでに資格を取得する

生成AIの資格を取得する

メジャー所でいえば、「生成AIパスポート」、「G検定(ジェネラリスト検定)」、「E資格」などがあります。

筆者自身は生成AIパスポートを受験していますが、体系的にまとまっており、基礎理解に大いに役立ちます。

資格が直ちにキャリアに繋がる訳ではありませんが、今後「AIの知識がある」事を証明できるだけでも、強い武器になるでしょう。

生成AIパスポート

生成AIパスポートは、一般社団法人生成AI活用普及協会が主催する、生成AI初心者向けの資格です。

基礎知識だけでなく、実際に使う際の指示文(※プロンプト)の入力方法、法的なリスクなども包括的に学習できます。

とくに、生成AIを発信や仕事に用いる場合、法的リスクを理解しないと、知らず知らずの内に権利侵害する恐れがあります。

権利によっては「わざとじゃない!」場合も処罰対象になる可能性がありますので、できれば頭に入れておきたいところです…。

G検定(ジェネラリスト検定)

G検定は、一般社団法人日本ディープラーニング協会が主催する、初心者~中級者向けの資格です。

生成AIパスポートで扱う範囲は大体網羅されていますが、これに加え数式など、AIの内部構造にフォーカスした問題が広く出題されます。

人によっては実用的ではない範囲も扱うため、「そこまでの知識は求めていない…」という方は生成AIパスポートでも十分でしょう。

E資格(エンジニア資格)

E資格は、G検定と同じく一般社団法人日本ディープラーニング協会が主催する、中級者~上級者向けの資格です。

シラバス内に「開発・運用環境」が含まれていることからも、よりエンジニア向けに設計されている事がわかります。

難易度は上記2つよりも高い事は明白で、特定のキャリアを目指す方や、ワンランク上を目指したい方にオススメの資格です。

3.最新の情報を取得する

最新のAI情報を取得する

資格にせよ、講座にせよ、年度ごとの更新はありますが変化のめまぐるしいAIは、半年も経てば情報が風化していきます。

鮮度の良い情報を入手する方法はSNSだけではありません。

ムック本から取得する

ムック本というのは、いわゆる雑誌の様な形態の書籍です。

単行本は体系的な理解には向きますが、発刊にかかる時間の性質上、どうしても情報の小回りが利きません。

こうした問題は、雑誌であれば幾分か小回りが利くので、網羅的に情報を取得するのに向いています。

SNSから取得する

「最新」「リアルタイム」といえば、真っ先にSNSが思い浮かぶ方もいるでしょう。

実際に検索されている方もいらっしゃるかもしれませんし、私自身も利用しています。

ただ、情報が散発的になりやすく、専門用語の補足が入れづらいため、体系的な理解には不向きです。

ある程度の知識をもって活用すると、非常に有用なツールとなります。

AIで取得する

AIの情報をAIで取得する、そんな使い方もオススメです。

よりリアルタイムにWEB上から情報を取得できるPerplexityや、スライド形式で直感的にまとめてくれるFelo(フェロー)もオススメです。

高機能にフォーカスしなければ、どれも無料で利用できますので、一度練習ついでに使用してみてはいかがでしょうか。

生成AIでスライド作成
生成AI「Felo」で無料作成したスライド
他にも、公式サイトやプレスリリースのチェックや、Googleアラートを通じた関連情報取得もオススメです

さいごに|GPT4.5は何が変わった?

ChatGPT o3-miniを使ったレビュー

2025年2月末にリリースされた「GPT4.5」について、実際に使ってみた所感と共に、「何が変わったのか」を記載しておきます。

GPT-4.5と前モデルとの比較は?

以下に挙げる表が、2025年1月に発表された「OpenAI o3-mini」や、現在主流の「GPT-4o」との公式比較表です。

なんか呪文みたいのが並んでるけど…

何やら難しそうな単語が並んでいます。できるだけ噛み砕いて説明していきますね。

引用:OpenAI

マルチモーダルに対応しつつ、STEM分野も強化

前表は上から順に、科学→数学→多言語理解→マルチモーダル→コーディング(プログラミングなど) という風に比較が並んでいます。

【豆知識】マルチモーダルってなに…?

文章、画像、音声など、複数の種類の情報を同時に扱える能力のことです。
あくまでも「画像生成専用のAI」などとの比較では弱くなります。

これまでGPTが苦手としていた、「STEM分野≒理数系分野」の性能(値)が上昇しているのが見て取れます。

STEM分野に特化した「oシリーズ」 には劣りますが、GPTシリーズも弱点を克服したことで、より「何でも器用にこなせるAI」に近づきました。

ハルシネーションが低減

特筆すべき点は、以下のグラフ(和訳:シンプルなQ&Aに対するハルシネーション、低いほど良い)です。

グラフでは、ハルシネーションの減少が見られたという点が強調されています。

改めてハルシネーションとは、「AIの嘘」すなわち、AIが学習していない項目を聞かれた際に、知ったかぶった回答をしてしまう事です。

引用:OpenAI

AIを使用する場合には大敵でしかないハルシネーションですが、GPT4.5は、4o比で約60%にまで低減されています。

その他の進化点は?

「より人間らしい自然な会話」や、「微妙なニュアンスの理解力」といった点での向上も、目玉として挙げられています。

この点に関しては、筆者自身GPT-4.5を使い初めて日が浅いので、公表されている数値ベースではなんとも言い難い部分です。

ただ、使っていて思ったのは「回答にかかる体感スピードが速い!」という点、他にも感じた事があれば随時追記させて頂きたいと思います。

関連記事

このエントリーをはてなブックマークに追加

-活用法