GPT-5.4の使い方と新機能を解説|PC操作・100万トークン対応

AIツール

GPT-5.4とは?3月5日リリースの最新モデル

2026年3月5日、OpenAIからGPT-5.4がリリースされた。GPT-5.2から3ヶ月でのアップデート。「また出たの?」って感じた人、少なくないと思う。

ただ今回、正直かなりデカい変更が入っている。

100万トークンのコンテキストウィンドウ。ネイティブPC操作。Tool Searchという新しいツール管理。この3つだけで、従来のGPTとは完全に別物。

僕は発表当日からAPIを触っているんだけど、とくにTool Searchが開発者目線で革命的だと感じています。これまで全ツール定義をプロンプトに詰め込んでいたのが、必要なときだけオンデマンドで読み込む方式に変更。トークン節約はもちろん、精度も体感で上がってる。

3つのバリアント — どれを選ぶ?

GPT-5.4には3つのモデルがあります。

  • GPT-5.4(標準) — 質問、文章生成、データ分析向け。レスポンスが速い
  • GPT-5.4 Thinking — 数学やコーディング、複雑な推論タスク用。回答前に「考える」ステップが入る
  • GPT-5.4 Pro — 最高精度が必要なプロ向け。API経由限定

加えて軽量版のminiとnanoも出ている。miniはコーディング・推論・マルチモーダル・ツール利用のすべてでGPT-5 miniを超えつつ、コストは大幅ダウン。

料金比較(API)

モデル 入力(/1Mトークン) 出力(/1Mトークン)
GPT-5.4 $2.50 $15.00
GPT-5.4(キャッシュ) $0.25
Claude Sonnet 4.6 $3.00 $15.00

入力コストはClaude Sonnet 4.6より安い。出力は同額。キャッシュを使えば入力10分の1。個人開発でAPI叩くならコスパかなり良いです。

ネイティブPC操作を試してみた

今回の目玉、ネイティブコンピューター操作。スクリーンショットを見ながらAIがマウスやキーボードを動かせる機能。

ChatGPTのOperator経由で利用可能で、「このサイトで○○を検索して」と指示すると実際にブラウザを操作してくれます。

僕が試したタスクはこんな感じ。

「Amazonで4K モニター 27インチの価格を比較して」

  1. ChatGPTにOperatorモードで指示
  2. AIがAmazon上で検索クエリを入力
  3. 上位5件の商品名・価格・レビュー数を取得
  4. 比較表を自動生成

所要時間は約2分。手動なら10分コース。OSWorldベンチマークでは75%のスコアを出していて、実用ラインに乗っている印象。

ただ、注意点も。

  • 操作速度は人間より遅い(1アクションごとにスクショ→判断のサイクル)
  • ログインが必要なサイトでは認証情報の扱いに要注意
  • たまに変なところをクリックする。完全放置はまだ厳しい

100万トークンコンテキストの実用例

GPT-5.2の128Kから一気に1Mトークンへ拡大。日本語なら新書10冊分くらいの情報を同時に処理できる計算になる。

大規模コードベースの丸ごと分析

プロジェクト全体のソースコードをコンテキストに入れて
「セキュリティ脆弱性を洗い出して」

5万行規模のPythonプロジェクトを投げてみたところ、依存関係の脆弱性3件とSQLインジェクションリスク1件を検出。以前はファイル分割が必要だったけど、その手間がゼロになった。

複数文書の横断チェック

契約書、技術仕様書、論文を一括投入して「この3つの矛盾点を指摘して」みたいな使い方。法務チェックや学術レビューの効率が段違い。

会話履歴の完全保持

チャットが長くなっても文脈が切れない。地味だけど、「2時間前に話した仕様変更を踏まえて」って言えるのはストレスフリーです。

Tool Search — エージェント開発のゲームチェンジャー

Tool Search — エージェント開発のゲームチェンジャー

API利用者向けの話だけど、Tool Searchの仕組みがとにかく良い。

従来のFunction Calling:

  • 全ツール定義をシステムプロンプトに記載
  • ツール増加でトークン消費が膨張
  • 50個超えると精度低下

GPT-5.4のTool Search:

  • 軽量なリストだけ保持
  • 必要なタイミングで定義をオンデマンド取得
  • ツール数増加でも精度を維持

tools = [
    {"type": "function", "function": {"name": "search_web", "description": "ウェブ検索"}},
    {"type": "function", "function": {"name": "send_email", "description": "メール送信"}},
    {"type": "function", "function": {"name": "create_image", "description": "画像生成"}},
    # 100個以上登録しても問題なし
]

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[{"role": "user", "content": "明日の天気を調べて"}],
    tools=tools
)

エージェント型アプリを作っている人には間違いなく朗報。僕自身、AIエージェント開発でツール数50超えのあたりから精度低下に悩んでいたので、これは助かる。

ChatGPTプラン別のアクセス

プラン GPT-5.4 Thinking 備考
Free レート制限きつめ
Go(月$5.5) Thinking経由のみ
Plus(月$20) 回数制限あり
Pro(月$200) ほぼ無制限

無料でもThinking経由で体験可能。ただレート制限がけっこう厳しいので、本格利用ならPlusプラン以上が現実的。

GPT-5.2からの移行ポイント

GPT-5.2 Thinkingは2026年6月5日に廃止予定。使っている人は早めに動いたほうがいい。

  • APIフォーマットに一部変更あり。プロンプト自体はほぼそのまま動くけど、ツール定義周りは要確認
  • 出力トークン上限が128Kに拡大。長文生成がかなり楽に
  • コストはGPT-5.2($1.75/$14)から微増。性能差を考えれば十分ペイする

GPT-5.4は「AIに任せる」を現実にした

GPT-5.4で、AIにできることのラインがまた上がった。

ネイティブPC操作と100万トークンコンテキスト。この2つが「AIに仕事を丸投げする」体験を現実的なものにしています。まだ完璧じゃないし、変なクリックはするし、速度面では人間のほうが速い場面も多い。

でも3ヶ月前のGPT-5.2と比べたら確実に良くなっている。この進化ペースが続けば、2026年後半にはAIエージェントがふつうに仕事してる世界が来てもおかしくない。

とりあえず無料プランのThinkingで触ってみるのが一番手っ取り早いです。API開発者なら、Tool SearchとComputer Useの組み合わせを早めに試しておくと、半年後に差が出る。



今すぐ始めるなら

※この記事は2026年3月23日時点の情報です。AI関連サービスの仕様・料金は頻繁に変わるので、最新情報はOpenAI公式サイトで確認してください。
※投資判断は自己責任でお願いします。本記事は特定サービスへの投資を推奨するものではありません。


この記事は AI Tech Fi が独自に収集・分析した情報です。最新のAI・テクノロジー・投資情報を毎日お届けしています。

ポリシー/運営情報: 利用規約 / プライバシーポリシー / お問い合わせ / 運営者情報

本サイトは情報提供を目的としており、特定の金融商品の売買を推奨するものではありません。投資判断はご自身の責任で行ってください。

コメント

タイトルとURLをコピーしました