ChatGPT o3-miniとここまでの軌跡を振り返る
このエントリーをはてなブックマークに追加

当ページには一部広告が含まれます。 活用法

【時系列】OpenAI(ChatGPT)o3-miniがリリース!モデルの違いを整理しよう

2025年2月、OpenAI(≠ChatGPT) o3-miniがリリースされました。

が…。モデルの変化が著しく、正直付いていけていない方も多いのではないでしょうか。

本記事ではそんな方に向けて、これまでにリリースされたGPTのモデルを、一度時系列順に整理してみました。

初心者の方でも親しめる様に、難しい専門用語などもできるだけ嚙み砕いて基本から説明しますので、ぜひ参考にしてみてください。

 

ChatGPTの概要

GPT-1から、o3 miniまでの流れについて

2022年に彗星の如く現れ、AI関連の話題をかっさらっていったChatGPT。

その原型は、2017年にGoogleが提唱した「Transformer」とよばれるしくみまでさかのぼります。

当初は「ChatGPT」ではなく、文章生成AI「GPT」として開発・発表されました。

Transformerは、GPT以外にも、GoogleのBERT、Meta社のRoBERTaなど、さまざまな派生モデルが登場するきっかけとなりました。

 

最初からChatGPTって名称だったわけではないんだね

 

2022年、ChatGPTとして正式リリース

2018年にGPT-1としてリリースされたGPTですが、2022年11月にGPT-3の強化版「InstructGPT」をベースにした会話型モデルとして「ChatGPT」を発表。

さらに、2023年3月に発表されたGPT-3.5を搭載することで、よりスムーズな対話が可能になりました。

ChatGPTは2022年11月のリリース直後から爆発的に普及し、数カ月で1億ユーザーを突破。 これにより、AIとの自然な会話は一気に広まりました。

 

【豆知識】InstructGPTってなに…?

人間からのフィードバックを学習(RLHF)し、より自然で適切な応答が可能になったGPTです。

指示(プロンプト)に対する回答精度が向上し、誤情報や不適切な回答が減少しました。

 

GPT|モデルの違いを時系列順で追ってみよう

モデル名できるようになったこと
2018年6月GPT-1AIが文章を作ることができるようになった
2019年2月GPT-2より長く、自然な文章が作れるようになった
2020年6月GPT-3より賢くなり、質問への答えが正確になった
2022年11月GPT-3.5AIとの会話がスムーズになり、使いやすくなった
2023年3月GPT-3.5 Turbo3.5を高速&低コスト化。主に長文の理解力が向上した
2023年3月GPT-4さらに正確で、複雑な質問にも答えられるようになった
2024年5月GPT-4 Turbo4を高速&低コスト化。主に長文の理解力が向上した
2024年5月GPT-4o文章だけでなく、画像や音声も理解できるようになった
2024年7月GPT-4o Mini4oの軽量版として、無料会員にも一般公開

「あれ?o3 miniないじゃん」と思った方もいらっしゃるかもしれません。

後述しますが、「oシリーズ」に関しては、いわゆる「GPTシリーズ」とは別枠で進歩しています。

まずは、GPT誕生から、現在の主流になっている「4o」モデルまでの軌跡について説明していきます。

 

1. GPT-1(2018年)

特徴

  • モデル名: GPT-1
  • パラメータ数: 約1.17億
  • トレーニングデータ: BookCorpus(約7,000冊の書籍)

開発当初の段階では、「質問に答えるAI」ではなく、文章をより自然に理解し、作るためのAIとして開発されました。

AIが単語や文章のパターンを学習し、滑らかな文章を作れるようになり、効率的に文脈を理解できるようになったのが特徴です。

この様な性質から、主に小説・記事・文章の補完などの用途で活用されました。

 

【豆知識】パラメータ数ってなに…?

パラメータ数とは、AIが「どれだけのことを学習しているか」を表す指標のひとつです。

単純に、パラメータ数が多いほど、より賢く、より複雑なことを考えられるイメージです。

 

2. GPT-2(2019年)

特徴

  • モデル名: GPT-2
  • パラメータ数: 最大15億
  • トレーニングデータ: インターネット上の大規模テキストデータ

GPT-2は、短い文だけでなく、ストーリーや記事などの長文を自然に作成できるようになったのが特徴です。

大小4種類のパラメーター数で開発されましたが、悪用リスク(フェイクニュースなど)が懸念され、最大モデルは暫く後に公開されました。

この段階ではまだ「会話型AI」ではありませんが、指示文(プロンプト)を工夫することで簡単なやりとりができるようになりました。

 

【豆知識】パラメータ数ってなに…?

トレーニングデータは、AIが学習するための膨大なテキストや画像などの情報データです。

GPTのトレーニングデータは、インターネット上の公開データ(書籍・論文・ニュース・ウェブサイトなど)を学習して作られています。

 

3. GPT-3(2020年)

特徴

  • モデル名: GPT-3
  • パラメータ数: 最大1750億
  • トレーニングデータ: Wikipedia、書籍、コードなど幅広いデータなど

GPT-3は、パラメータ数が1750億(GPT-2の約100倍)に拡大し、遂に人間のような自然な会話ができるようになりました。

事前に学習していなくても、少しの例を見せるだけで対応できる「柔軟性」が向上したのも特徴です。

また、開発者向けにGPT-3のAPI(※接点)が提供され、AIを組み込んだアプリやサービスが急増。用途が一気に拡大しました。

それと同時に、「会話が進むと矛盾が出る」、「ハルシネーション」といった問題点も表面化してきます。

 

【豆知識】ハルシネーションってなに…?

直訳で「幻覚」を表し、AIが事実ではない情報をあたかも本当のように生成する現象のことです。

AIが学習データの範囲外の情報を補完しようとする際に発生しやすくなり、「AIの嘘」とも称されます。

現在は大幅な改善はみられるものの、ゼロになった訳ではないため、人手による最終チェックは必ず必要になります。

 

4. GPT-3.5(2022年)

特徴

  • モデル: GPT-3.5
  • パラメータ数: 非公開(推定3000億前後)
  • 会話できるAIとして広く知れ渡った原点に

GPT-3.5は、会話特化型のAIとして開発され、より自然で安全な対話ができるようになったモデルです。

InstructGPTや、RLHF(人間のフィードバック学習)などの会話の質にフォーカスした機能を導入し、回答の質が向上しました。

また、「ChatGPT」として無料提供された事で爆発的に話題性が向上。多くのユーザーの目に留まる事になりました。

 

5. GPT-3.5 Turbo(2023年3月)

こんな方におすすめ

  • モデル: GPT-3.5 Turbo(ターボ)
  • パラメータ数: 非公開
  • GPT-3.5の高速&低コスト化に成功

GPT-3.5と比べて、処理速度が速く、運用コストも削減したモデルです。

そのため、無料ユーザー向けにも安定した提供が可能になりました。

長らく無料で使えるGPTとして親しまれてきた標準モデルでしたが、現在ではGPT4o-Miniにその座を譲りました。

 

6. ChatGPT-4(2023年3月)

特徴

  • モデル: GPT-4
  • パラメータ数: 非公開
  • 画像理解や、長文理解力の向上

GPT-4は、テキストだけでなく、画像も理解できるAI(※マルチモーダル)として進化し、より正確で賢くなりました。

AIが処理できるトークン数がGPT-3.5の約4,000から約9倍にまで拡大し、長い会話や、大量のテキストを扱う能力が向上しています。

また、ハルシネーションの減少により、知識の正確さが重要な場面(医療・法律・教育など)でより信頼できる回答が可能になりました。

 

【豆知識】トークンってなに…?

AIが文章を処理するときの最小単位(単語や文字のかたまり)のことです。

日本語の場合、ひらがなは1文字1-2トークン、漢字など画数が多い場合は更に多くのトークン数を要します。

処理できるトークン数を超えると、「使用制限に達しました」のメッセージと共に、数時間使用できなくなります。

 

7. ChatGPT-4 Turbo(2023年11月)

特徴

  • モデル: GPT-4 Turbo(ターボ)
  • パラメータ数: 非公開
  • GPT-4の高速&低コスト化に成功

GPT-4 Turboは、より高速&低コストをテーマにしつつ、長文の理解力も大幅に向上したGPT-4の改良版です。

文字数制限の基準となる、トークン数がGPT-4と比較して更に3倍程度向上し、より多くのテキストを扱える様になりました。

また、難しい問題も解けるようになり、コード生成、数学の問題、物語の創作など、幅広い分野で活躍を見せ始めます。

 

8. GPT-4o(2024年5月)

特徴

  • モデル名: GPT-4o(オムニ)
  • パラメータ数: 非公開
  • 画像認識に加え、音声認識が可能に

GPT-4oは4-turboに似通っていますが、テキストや画像に加え、音声まで統合的に処理できる「マルチモーダルAI」として正統進化しました。

リアルタイムでの音声認識や応答が可能になり、使用シーンがさらに拡大したのが特徴です。

また、4-turboと比較して速度面でもコスト面でも向上しています。

 

9. GPT-4o Mini(2024年7月)

特徴

  • モデル名: GPT-4o Mini(ミニ)
  • パラメータ数: 非公開
  • 無料で使用できる4シリーズ。2025年初頭現在の標準モデル。

GPT-4o Miniは、GPT-4oの軽量版として登場しました。

4oには性能面で劣りますが、大きな特徴は「無料で使用できる」点。

ついに無料でもGPT-4シリーズの性能を体験できるようになり、GPT3.5の後継として今現在多くのユーザーに親しまれているモデルです。

 

派生進化した「OpenAI oシリーズ」

openAI oシリーズの性能比較図

引用:OpenAI

モデル名できるようになったこと
2024年o1-preview数学やプログラミングなど、難しい問題に強くなった
2024年o1-minio1-previewを軽くして、より速く動くようにした
2025年o3-minio1-miniよりももっと速く、もっと賢くなった

GPTの正統進化とは別枠で発展しているのが、数字の前に「o」の文字を冠した「oシリーズ」です。

「ChatGPT oシリーズ」ではなく、「OpenAI oシリーズ」を正式名称としている事からも、別枠であることがうかがえます。

oシリーズは「AIがより深く考えるためのモデル=推論モデル」として、GPTとは異なる方向性で発展しています。

 

広く「ChatGPT o1」と誤認されている上、「4o」というモデルがあるため、認識をややこしくしています

 

1. o1シリーズ(2024年9月)

こんな方におすすめ

  • モデル名: o1-preview、o1-mini
  • ChatGPTシリーズと比べ、推論能力が強化されている

o1 thinks before it answers—it can produce a long internal chain of thought before responding to the user.

"o1 は答える前に考えます。つまり、ユーザーに応答する前に、思考の長い連鎖を生み出すことができます。"

引用:Open AI  2024年年9月12日

高度な推論能力を備え、とくにSTEM分野(科学、技術、工学、数学)などの複雑なタスクに特化しています。

コーディングや数式などを扱うエンジニアの方々に恩恵がありますが、逆に日常使いでは推論の時間が増す分、有用性が下がる一面も。

また、o1-miniはスペックが高くないPCなど、リソースが限られた環境でも快適に動作する様に作られたモデルです。

 

【豆知識】推論ってなに…?

推論(すいろん)とは、すでにある情報をもとに、新しい結論を導き出すことです。

考えたり、予測したりする過程のことを指します。

 

2. o3シリーズ(2025年1月)

こんな方におすすめ

  • モデル名:o3-mini
  • o1に比べ、更に推論能力を強化

o3-mini with medium reasoning effort matches o1’s performance in math, coding, and science, while delivering faster responses. 

"o3-miniは中程度の推論努力で、数学、コーディング、科学の分野で o1 のパフォーマンスに匹敵し、より高速な応答を実現します。”

引用:Open AI  2025年1月31日

o1の高い推論能力を継承しつつ、高速性とコスト効率を向上させたモデルです。

何か新しいことができる様になったというよりは、引き続きSTEM(科学、技術、工学、数学)分野でのタスクに重点を置いて改良されたモデルです。

無料ユーザーにも制限付きで提供されている事から、注目が集まっています。

 

有料版との違い|現在利用できるモデルは?

プラン月額料金主な特徴
無料プラン無料・標準で「GPT-4o Mini」を使用可能
・「GPT-4o」への制限付きアクセスあり
・音声チャット、GPTsなどの基本機能利用可
Plusプラン$20/月・「GPT-4o」の使用制限が引き上げられる
・画像生成機能が利用可能
・高度な音声入力、動画入力に対応
・Soraを用いた動画生成が可能
Proプラン$200/月・Plusプランの全機能を含む
・o1, o1-mini, GPT-4oの制限撤廃
・o1 Proモードにアクセス可能
・Soraを用いた動画生成の拡張機能利用可
・プロ向けの高度なAI活用が可能

2025年2月現在、各プランのユーザーがどのモデルにアクセスできるかを記載しておきます。

前述したモデル別解説と併せてご覧になってみてください。

 

無料ユーザーは?

標準で使えるのは「GPT-4o mini」および、「GPT-4oへの制限付きアクセス」のみとなります。

音声チャットや、ChatGPTを自分好みにカスタマイズできる「GPTs」など一通りの機能は使用できます。

日常でちょっとAIを使ってみたい、とりあえず試してみたい、そんな方はまずは無料プランで十分です。

 

Plusプラン(月額20ドル)

画像生成や、高度なやりとり、GPT-4oでのやりとりの制限が引き上げられます。

また、気分を察知するといった「高度な音声入力」や、動画入力についてのアクセスが可能に。

他にも、soraを用いた動画生成など、新機能に一早くありつけるのもメリットです。

>>動画生成AI「sora」についての解説はこちら

 

Proプラン(月額200ドル)

Plusのすべての機能に加え、o1, o1-mini, GPT-4o、高度な音声入力の制限が撤廃されます。

また、より高度な問題に対して最適な回答が得られる「o1 Proモード」にアクセスできる他、soraを通じた動画生成の拡張性が向上します。

まさに「プロ」向けのプランであり、AIを本格的に仕事で用いたい場合に有用なプランです。

 

ChatGPTはどこから利用できる?

こちらのページが、OpenAI直下のChatGPT公式サイトになります。

飛び先の「今すぐ始める」を選択するとブラウザ版で、「アプリをダウンロードする」を選択するとデスクトップアプリ版で開始できます。

ブラウザ版(※とくにChrome)は気軽に起動できる強みがありますが、アップデート直後など、挙動がおかしくなる事が多々あります。

環境に合わせて使用してみてください。

 

スマートフォンの方は、アプリストアからダウンロード可能です。類似のアプリにご注意ください

 

今後の展望|AIエージェント

AIエージェントについてのイメージ像

AIエージェントとは、単なるチャットボットや質問応答AIとは異なり、ユーザーの代わりにタスクを実行し、より自律的に動作するAI のことを指します。

推論能力が発達してきた事により、「与えられた指示に回答を返すだけ」のAIから脱却する研究が進められています。

 

ビジネスシーンでの今後

例えば…

・メールの自動送信や自動返信(特定の条件に応じてメールを処理)

・会議のスケジュール管理(関係者の空き時間を調整し、自動で予約)

・レポート作成・データ分析(売上データを元に、AIが自動でレポートを作成)

このように、AIエージェントは、社内業務の自動化に貢献することが予想されます。

 

個人アシスタントとしての今後

例えば…

・日常のタスク管理(ToDoリストの自動作成・リマインダー設定)

・オンラインショッピングの最適化(価格比較をして最安値で購入)

・旅行プランの自動作成(フライトやホテルの予約を最適化)

Googleが開発した「Gemini」に関しては、早くもGoogleカレンダーやGmailとの連携がスタートしています。

これによって、Gmailに届いた飲み会の予定をGoogleカレンダーに登録してもらうなど、只の対話に留まらない使い方が始まっています。

 

生成AIについてもっと学びたい場合は?

中国発祥の「Deepseek」の話題でも持ち切りですが、とにかく進化の著しいAI。

ChatGPTはじめ、Gemini、Perplexity、Genspark…LLM(Large Language Model)系のAIだけでも、挙げればキリがありません。

「AIを学ぼう!」と思って書籍を買ってもイマイチ情報効率が悪い…そんな方に向けて、オススメの「情報の仕入れ」について掲載しておきます。

 

1.AIの勉強ついでに資格を取得する

生成AIの資格を取得する

メジャー所でいえば、「生成AIパスポート」、「G検定(ジェネラリスト検定)」、「E資格」などがあります。

筆者自身は生成AIパスポートを受験しておりますが、体系的にまとまっており、基礎理解におおいに役立ちます。

勉強ついでにキャリアアップの礎にもなりますので、興味があれば検討してみては如何でしょうか。

 

生成AIパスポート

生成AIパスポートは、一般社団法人生成AI活用普及協会が主催する、生成AI初心者向けの資格です。

基礎知識だけでなく、実際に使う際の指示文(※プロンプト)の入力方法、法的なリスクなども包括的に学習できます。

とくに生成AIを発信や仕事で扱う場合、法的リスクを理解しないと、知らず知らずの内に権利侵害する恐れがあります。

 

権利によっては「わざとじゃない!」場合も処罰対象になる可能性がありますので、できれば頭に入れておきたいところです…。

 

G検定(ジェネラリスト検定)

G検定は、一般社団法人日本ディープラーニング協会が主催する、初心者~中級者向けの資格です。

生成AIパスポートで扱う範囲は大体網羅されていますが、これに加え数式など、AIの内部構造にフォーカスした問題が広く出題されます。

人によっては実用的ではない範囲も扱うため、「そこまでの知識は求めていない…」という方は生成AIパスポートでも十分でしょう。

 

E資格(エンジニア資格)

E資格は、G検定と同じく一般社団法人日本ディープラーニング協会が主催する、中級者~上級者向けの資格です。

シラバス内に「開発・運用環境」が含まれていることからも、よりエンジニア向けに設計されている事がわかります。

難易度は上記2つよりも高い事は明白で、特定のキャリアを目指す方や、ワンランク上を目指したい方にオススメの資格です。

 

2.講座を視聴する、スクールに通う

生成AIをスクールや講座で学ぶ

より実践的に学びたいのであれば、「ビジュアル」や「手を動かす」といったプロセスを踏める講座やスクールがオススメです。

補助金を活用することで、場合によっては格安で受講できる場合もあります。

 

講座を視聴する

昨今ではUdemyやYoutubeなど、安価(※または無料)でも質の高い講座が簡単に受講できる様になりました。

どちらも一長一短ですが、Udemyの場合は情報更新するとカリキュラム全体に歪みが発生してしまう観点から、最新情報を追うのが難しい印象です。

Udemyでは体系的に基礎を学び、ある程度理解した段階で、Youtubeで新しい情報を追うのがオススメです。

 

スクールに通う

UdemyやYoutubeなどの講座や書籍に通じて言えるのは、「受動的な学び」がメインになるという点です。

実際に手を動かして、より実践に即した学習をしたいなら,スクールに通うのは非常に効率的な学びになります。

 

>>生成AIを学ぶオススメの講座やスクールについての情報はこちら

 

3.最新の情報を取得する

最新のAI情報を取得する

資格にせよ、講座にせよ、年度ごとの更新はありますが変化のめまぐるしいAIは、半年も経てば情報が風化していきます。

鮮度の良い情報を入手する方法はSNSだけではありません。

 

ムック本から取得する

ムック本というのは、いわゆる雑誌の様な形態の書籍です。

単行本は体系的な理解には向きますが、発刊にかかる時間の性質上、どうしても情報の小回りが利きません。

こうした問題は雑誌であれば幾分か小回りが利くので、網羅的に情報を取得したい際にはもってこいです。

 

SNSから取得する

「最新」「リアルタイム」といえば、真っ先にSNSが思い浮かぶ方もいるでしょう。

実際に検索されている方もいらっしゃるかもしれませんし、私自身も利用しています。

ただ、情報が散発的になりやすく、専門用語の補足も入れづらいため、体系的な理解には不向きです。

ある程度の知識をもって活用すると、非常に有用なツールとなります。

 

AIで取得する

AIの情報をAIで取得する、そんな使い方もオススメです。

よりリアルタイムにWEB上から情報を取得できるPerplexityや、スライド形式で直感的にまとめてくれるFelo(フェロー)もオススメです。

高機能にフォーカスしなければ、どれも無料で利用できますので、一度練習ついでに使用してみてはいかがでしょうか。

生成AIでスライド作成

生成AI「Felo」で無料作成したスライド

 

他にも、公式サイトやプレスリリースのチェックや、Googleアラートを通じた関連情報取得もオススメです

 

さいごに|o3 Mini、実際に使った感想は?

ChatGPT o3-miniを使ったレビュー

実際に、1日o3 Miniを使って作業してみて感じたことを記載していきます。

結論から言えば、十分進歩したと感じるレベルではありました。

 

推論の時間が明らかに短縮した

o1の時点では推論の時間が長く、zero-shotプロンプティングですら推論中から進まないことが多々ありました。

このため、結局4oに戻して使っていた訳ですが、o3-miniでは実用的な段階まで推論の時間が短縮したと感じます。

使い手やプロンプトによって意見はまちまちかもしれませんが、筆者自身は十分実用的な範疇だと感じています。

 

【豆知識】zero-shotプロンプティングってなに…?

「例:この単語要約して」の様に、聞きたいことをそのまま入力して、回答を得るシンプルな指示(≒プロンプト)です。

反面、「例:この例に沿って要約して」の様に例示して回答を得る際は、例の数に応じて「one-shot」「few-shot」とよびます。

 

ハルシネーションの対策が為されている

4oで聞いたときはまだまだ、「ん…?」という回答もある印象でした。

o3miniに変えて同じプロンプトで質問すると、ソースが不足している情報は「言及が難しい」という回答に変わりました。

単に「お答えできません」の趣旨で返ってくるだけでなく、「こうしてみたら?」という具体案もセットで返してくれる点に進歩を感じます。

 

関連記事

>>ChatGPTを日々の勉強で使用したい方はこちら

 

>>AIで資料作成を効率化するなら

 

 

 

このエントリーをはてなブックマークに追加

-活用法