OpenAI o1とは「人間のように応答する前により多くの時間をかけて思考するように設計された新しいAIモデルシリーズ」です。特に科学、コーディング、数学の分野で難しい問題を解決することができます。また、o1-previewとo1-miniの2つのモデルがあり、o1-miniはより高速で低コストとなっています。
2024年9月12日(現地時間)に、OpenAIは新たなAIモデルシリーズ「OpenAI o1」を発表しました。本記事ではOpenAI o1の特徴や料金、使い方について詳細に解説していきます。
弊社Walkersでは、“AIトレンドに乗り遅れたくないけど、具体的な活用法が見えない…”を解決するAI導入支援を行っています。補助金により1/3のコストで導入可能なので、ぜひAI活用にお悩みがある方はお気軽にご相談下さい。⇒AI導入支援サービスの概要はこちら
執筆者:山口 鳳汰
ノーコード・AI開発会社「Walkers」のCMO。
AIサービス「Prompt Lab」運営。
その他、受託開発や教育など多数のAI事業に参画している。
運営会社:株式会社Walkers
ノーコード・AI専門の開発会社。
300件以上の開発/制作実績、200件以上の企業様を支援。
マーケティングやUI/UXと掛け合わせたサービス開発を得意としている。
執筆者:山口 鳳汰
ノーコード・AI開発会社「Walkers」のCMO。
AIサービス「Prompt Lab」運営。
運営会社:株式会社Walkers
ノーコード・AI専門の開発会社。
これまでに300件以上の開発/制作実績、200件以上の企業様を支援。
OpenAI o1とは?
OpenAI o1とは「人間のように応答する前により多くの時間をかけて思考するように設計された新しいAIモデルシリーズ」です。
o1-previewとo1-miniの2つのモデルがあり、o1-previewでは、科学、数学、コーディング分野で優れたパフォーマンスを発揮します。o1-miniは、計算リソースを節約しつつ、推論能力を必要とするタスクに最適化されています。
GPT-4oとの違い
OpenAI o1とGPT-4oとの違いは「精度の高さ」と「機能の多さ」です。
【違い①】精度の高さ
OpenAI公式より、国際数学オリンピックの予選試験を双方に受けさせた結果について以下のように報告されています。
国際数学オリンピック(IMO)の予選試験では、GPT-4o は問題のわずか 13% しか正しく解けませんでしたが、推論モデルは 83% のスコアを獲得しました。彼らのコーディング能力はコンテストで評価され、Codeforces コンテストでは 89 パーセンタイルに達しました
OpenAI公式
よって、OpenAI o1での出力はGPT-4oよりもはるかに精度が高くなっています。
【違い②】機能の多さ
OpenAI公式より、OpenAI o1の機能性について以下のように言及されています。
初期モデルであるため、Web で情報を閲覧したり、ファイルや画像をアップロードしたりするなど、ChatGPT を便利にする多くの機能がまだ備わっていません。多くの一般的なケースでは、GPT-4o は近い将来、より優れた機能を備えるようになるでしょう。
しかし、複雑な推論タスクの場合、これは大きな進歩であり、AI 機能の新たなレベルを表しています。これを踏まえて、カウンターを 1 にリセットし、このシリーズを OpenAI o1 と名付けます。
OpenAI公式
つまり、OpenAI o1では「Web閲覧やアップロード機能などが備わっていない」ということです。
よって精度が求められる場面ではOpenAI o1が、日常使いではGPT-4oを利用するのが一般的となるでしょう。
OpenAI o1の4つの特徴
OpenAI o1の特徴としては以下の4つが挙げられます。
- 思考時間の増加: OpenAI o1は、応答する前により多くの時間をかけて思考するように設計されています。これにより、複雑なタスクの推論能力が向上し、科学、コーディング、数学の分野で優れた性能を発揮します。
- モデルバリエーション: o1には「o1-preview」と「o1-mini」の2つのバリエーションがあります。o1-previewは難しい問題を解決するために設計されており、o1-miniはより高速で低コストなモデルで、特にコーディングや数学に優れています。
- 性能評価: テスト結果では、物理学、生物学、化学のベンチマークで博士課程の学生と同等の成績を上げています。また、国際数学オリンピックの予選試験では高い正答率を達成し、Codeforcesの競技で89パーセンタイルに達しました。
- 安全性: 新しい安全性学習手法を導入し、安全ルールを効果的に適用できるようになっています。ジェイルブレイクテストでも高い安全性スコアを獲得しています。
OpenAI o1の料金
利用料金
月20ドルの有料プランを契約すると、OpenAI o1を利用できるようになります。
API料金
以下はOpenAI o1とGPT-4oのAPI料金を表したものになります。
OpenAI o1の使い方
有料プランを契約することで、以下の手順で利用可能です。
ただし、o1-preview の場合は 30 メッセージ/週、o1-mini の場合は 50 メッセージ/週しか使えないため注意が必要です。
ネットでの参考になる反応
o1 すげぇな。今まで頼りづらかった抽象度の高いタスクが、丸投げできるやん。
— 平岡 | 誰も置いていかない生成AI発明家 (@hiraoka_dx) September 12, 2024
事業計画とか作らせてみたら、精度全く違う。
軽くパワハラしてたら、めちゃくちゃカクカクしたことだけ玉に瑕。笑 pic.twitter.com/FdY4VRZQxY
📣OpenAI o1が発表されました🙌✨
— タカ|No NFT, No Life❤ (@web3taka) September 12, 2024
コーディングが得意になったらしいので、早速LPを作ってもらう👨💻
4oとo1とo1-mini
同じプロンプトで比較👀
パッと見た感じは、
o1-miniが圧勝やな🤔
処理も爆速⚡素晴らしい👏… pic.twitter.com/iSzttD6dDi
OpenAI o1 でGPT-o4やClaude 3.5 で解けない問題を出したら解けました。(Geminiも解けたが汚い解法だった)
— 磯野凪平 (@Nagihei_isono) September 13, 2024
以下、すごいと感じた点
・途中まではo4と同じだが、うまくいきそうにないと見切りをつけ他の方法を模索したこと
・逆数の和とかよく思い付いたな
・答えのチェック。メタ認知ができてる。 pic.twitter.com/zur2laW0Ft
ところで私は研究者ということもあり、OpenAIのChatGPT、Google Gemini pro、Anthropic Claudeの全てに課金している稀有なユーザー(周りの研究者は意外と一部は切ってる)なので、OpenAI o1を含め東大数学試験を解かせてみました
— 今井翔太 / Shota Imai@えるエル (@ImAI_Eruel) September 13, 2024
結果として確かにOpenAI o1はかなり精度よく解けました。… https://t.co/C7kLC5qdJu pic.twitter.com/vqTJ5P2iGK
やっぱり gpt o1 圧倒的だわ。
— 元木大介ᯅシステム生成AI Babel/Zoltraak & 生成AI塾 (@ai_syacho) September 12, 2024
何度やっても要求概要の記載がClaude3.5の比じゃない。
これまで日本語における要件定義書の生成、修正はCladueがダントツ一番だったけど、確実に超えた。
3月から半年に渡る日本語文書生成能力におけるClaude天下を塗り替えた。 https://t.co/jWPfmhN8ko pic.twitter.com/Ca5qZdvEje
OpenAI o1の解説は以上です。この情報がお役に立てていれば嬉しく思います。
弊社Walkersでは、“AIトレンドに乗り遅れたくないけど、具体的な活用法が見えない…”を解決するAI導入支援を行っています。補助金により1/3のコストで導入可能なので、ぜひAI活用にお悩みがある方はお気軽にご相談下さい。