xAIはGrok 4.3を段階的に展開しました。2026年4月17日にベータ版、4月30日にAPIアクセス、5月6日に完全な一般提供を開始しました。その特徴は明確です。1,000,000トークンのコンテキストウィンドウ、Grokシリーズで初のネイティブビデオ入力、常時稼働の推論機能、そしてGrok 4.20と比較して約40%の価格引き下げです。8つのレガシーGrokモデルは5月15日に廃止されるため、grok-3またはgrok-4シリーズを使用しているユーザーは今週中に移行計画を立てる必要があります。
このガイドでは、コードからGrok 4.3を呼び出す方法について説明します。エンドポイントの形式、認証、OpenAI互換のベースURL、推論エフォートパラメータ、ビデオ入力、関数呼び出し、およびApidogでの動作確認済みテスト設定について解説します。
同じリリースの音声側については、Grok Voiceを無料で使う方法をご覧ください。OpenAIの主力音声モデルとの比較については、Grok Voice vs GPT-Realtimeをご覧ください。
要点
- Grok 4.3は2026年5月6日にGAとなりました。8つのレガシーモデルは2026年5月15日に廃止されます。
- 価格: 入力トークン100万件あたり1.25ドル、出力トークン100万件あたり2.50ドル、キャッシュされた入力は100万件あたり0.20ドル。Grok 4.20と比較して約40%の値下げです。
- **100万トークンのコンテキストウィンドウ**。ネイティブ**ビデオ入力**。常時稼働の推論機能。
- 推論エフォート:
low/medium/high。デフォルトはmediumです。 - エンドポイント:
https://api.x.ai/v1/chat/completions(OpenAI互換のベースURL)。 - スループット: 標準ティアで約159トークン/秒。
- インテリジェンス指数 53(Artificial Analysis)、世界146モデル中10位。
- Apidogを使用して、リクエストをスクリプト化し、推論設定を変数として保持し、GrokおよびOpenAI互換モードの両方で再生します。
Grok 4.3で何が変わったか
ほとんどのチームにとって影響の大きい主要なアップグレードは以下の通りです。
- **40%の値下げ**。入力はGrok 4.20比で37.5%減、出力は58.3%減。キャッシュされた入力料金は100万トークンあたり0.20ドルとなり、長くて安定したシステムプロンプトが大幅に安くなる積極的な引き下げです。
- **100万トークンのコンテキスト**。Grok 4.20の256kから増加。中規模のコードベース、完全な決算説明会、または完全な法的契約書を1つのプロンプトに収めるのに十分です。
- **ネイティブビデオ入力**。Grokシリーズで初めて。ビデオURLを渡すと、モデルがフレームをネイティブに推論します。
- **常時稼働の推論機能**。Grok 4.3はすべてのリクエストでベースラインの推論ステップを実行します。
reasoning_effortパラメータは深さを調整しますが、モデルの推論レベルがlowより低くなることはありません。 - **大幅なエージェント機能向上**。Grok 4.20と比較してGDPval-AAで300 Eloポイント向上。ツールのディスパッチと多段階ワークフローの動作が著しく改善されました。
インテリジェンス指数53(Artificial Analysis)により、Grok 4.3は同価格帯の平均35を上回り、追跡対象146モデル中10位に位置しています。
前提条件
最初のリクエストを行う前に、次の4つの準備をしてください。
console.x.aiで**xAIコンソールアカウント**を取得すること。Grok Voiceと同じログインフローです。- APIキーを持つ有料ティアであること。本番環境ではプロジェクトスコープのキーが推奨されます。
- **OpenAI SDK**(Grok 4.3はOpenAI互換)またはxAI SDK。どちらでも機能します。
- ターミナルを乱雑にすることなくリクエストを再実行できる**APIクライアント**。

一度キーをエクスポートします。
export XAI_API_KEY="xai-..."
エンドポイントと認証
Grok 4.3は、OpenAI互換のChat Completionsインターフェースで、xAIのベースURLを使用して提供されます。
POST https://api.x.ai/v1/chat/completions
認証はベアラートークンです。ヘッダーは標準です。
Authorization: Bearer $XAI_API_KEY
Content-Type: application/json
OpenAI互換性により、OpenAI PythonまたはNode SDKを導入し、base_urlを変更するだけで済みます。これは、gpt-4またはgpt-5から移行するほとんどのチームにとって最も抵抗の少ない方法です。
from openai import OpenAI
client = OpenAI(
api_key=os.environ["XAI_API_KEY"],
base_url="https://api.x.ai/v1",
)
response = client.chat.completions.create(
model="grok-4.3",
messages=[
{"role": "user", "content": "Summarize the trade-offs of GraphQL vs REST in three bullets."}
],
reasoning_effort="medium",
)
print(response.choices[0].message.content)
xAI SDKをご希望の場合、呼び出し形式は同じです。変更点はインポートのみです。
リクエストパラメータ
Grok 4.3の全パラメータマップ:
| パラメータ | タイプ | 値 | 備考 |
|---|---|---|---|
model |
string | grok-4.3 |
必須。 |
messages |
array | OpenAIメッセージ形式 | 必須。role: system / user / assistantをサポートします。 |
reasoning_effort |
string | low, medium, high |
オプション。デフォルト: medium。高いレベルはレイテンシと出力トークンを増加させます。 |
max_tokens |
int | 1–32768 | 出力を制限します。 |
temperature |
float | 0.0–2.0 | デフォルトは1.0です。 |
top_p |
float | 0.0–1.0 | 核サンプリング。 |
stream |
bool | true / false | trueの場合、サーバー送信イベント。 |
tools |
array | OpenAIツール形式 | 関数呼び出し。 |
tool_choice |
string / object | auto, none, または特定のツール |
標準的なOpenAIのセマンティクス。 |
response_format |
object | { type: "json_object" } |
構造化出力。 |
seed |
int | 任意 | temperature: 0での再現性のため。 |
動作するcurlリクエスト:
curl https://api.x.ai/v1/chat/completions \
-H "Authorization: Bearer $XAI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-4.3",
"messages": [
{"role": "system", "content": "You are a senior backend engineer."},
{"role": "user", "content": "Review this query plan and flag the bottleneck."}
],
"reasoning_effort": "high"
}'
応答は、標準のOpenAI形式であるchoices[].message.contentと、prompt_tokens、completion_tokens、reasoning_tokens、およびtotal_tokensを内訳として含むusageオブジェクトを伴います。
推論エフォート
具体的なガイダンスを伴う3つのレベル:
- **
low**。分類、要約、ルール抽出、簡単なQ&Aに使用します。レイテンシは短く、出力は直接的です。 - **
medium**。デフォルト。カスタマーサービス、関数呼び出し、データ分析、単一ステップのツール使用に使用します。ほとんどの運用トラフィックに対して十分な推論深度です。 - **
high**。多段階エージェント、長鎖コードレビュー、複雑な数学、および回答前にモデルが計画を立てる必要があるタスクに使用します。
常時稼働の推論機能とは、lowであっても何らかの思考が行われることを意味します。これがGrok 4.20に対する事実正確性の向上を推進する要因です。推論を完全に避けることで費用を節約できるとは思わないでください。それは組み込まれています。
関数呼び出し
標準のOpenAI形式が直接機能します。ツールを宣言すると、モデルはアシスタントメッセージにtool_calls配列を出力し、それを実行し、toolロールメッセージで応答します。
tools = [{
"type": "function",
"function": {
"name": "lookup_user",
"description": "Look up a user by ID.",
"parameters": {
"type": "object",
"properties": {"user_id": {"type": "string"}},
"required": ["user_id"],
},
},
}]
response = client.chat.completions.create(
model="grok-4.3",
messages=[{"role": "user", "content": "Find user u_42 and tell me their last login."}],
tools=tools,
reasoning_effort="medium",
)
tool_calls = response.choices[0].message.tool_calls
GDPval-AAにおける300Eloポイントの向上は、ここで実際に現れています。Grok 4.3は、より良いツールを選択し、冗長な呼び出しを減らし、ツールのエラーからスムーズに回復します。ツールフローをテストしている場合、ApidogでのMCPサーバーテストは、当社が内部で使用しているリプレイ設定をカバーしています。
ビデオ入力
Grok 4.3は、ネイティブビデオ入力機能を備えた初のGrokモデルです。コンテンツブロック内にビデオURLを渡します。
response = client.chat.completions.create(
model="grok-4.3",
messages=[{
"role": "user",
"content": [
{"type": "text", "text": "Describe what happens in this clip and flag any anomalies."},
{"type": "video_url", "video_url": {"url": "https://example.com/clip.mp4"}},
],
}],
)
ビデオトークンは入力メーターに対してカウントされます。長いクリップはコンテキストを急速に消費するため、コストが重要な場合は送信前にダウンサンプリングまたはトリミングしてください。モデルはフレームをネイティブに推論するため、手動でキーフレームを抽出する必要はありません。
100万トークンコンテキスト
100万トークンのコンテキストウィンドウは、ベンチマークの成果物ではなく、実際の生産ツールです。一般的な使用パターンは以下の通りです。
- **コードベース全体のコードレビュー**。差分、変更されたすべてのファイル、およびリントの出力を連結します。Grokにレビューを依頼します。
- **長文ドキュメントのQ&A**。200ページの契約書を投入し、特定の質問をします。
- **会話履歴**。パーソナライゼーションのために、エージェントの会話全体を1か月間コンテキストに保持します。
100万トークンあたり0.20ドルのキャッシュ入力により、これが手頃になります。安定して保持する40万トークンのシステムプロンプトは、新規呼び出しで0.50ドルかかる代わりに、キャッシュされた呼び出しあたり0.08ドルで済みます。
レガシーGrokモデルからの移行
8つのレガシーGrokモデルは**2026年5月15日午後12時(PT)**に廃止されます。これらのいずれかで運用している場合、期限までにmodel文字列をgrok-4.3に切り替えてください。リクエスト形式は変更されていないため、ほとんどの呼び出しは追加の変更なしで機能します。
注意すべき点は2つあります。
- **推論エフォート**。一部のレガシーモデルは
reasoning_effortを受け入れませんでした。Grok 4.3は常に推論を実行します。以前のコードが高速な非推論パスに依存していた場合、レイテンシの増加を受け入れるか、lowに留まってください。 - **出力形式**。Grok 4.3はデフォルトでGrok 4.20よりも構造化されています。強力な正規表現による後処理を使用していた場合は、切り替える前に再テストしてください。
OpenAIライン全体の完全な価格比較については、GPT-5.5の価格設定を、推論モデルの比較については、GPT-5.5 APIの使用方法をご覧ください。
Apidogでのテスト
Grok 4.3を独自のユースケースに対して検証する最速の方法は以下の通りです。
XAI_API_KEYとBASE_URL = https://api.x.ai/v1を持つApidog環境を作成します。low、medium、highの推論を含む3つのバリアントを持つリクエストコレクションを保存します。プロンプトは同じで、エフォートが異なります。- 3つすべてを実行します。応答、レイテンシ、および
usage.reasoning_tokensのカウントを並べて比較します。 - OpenAIのベースURLを指す4番目のバリアントを追加し、Grok 4.3とGPT-5.5を同じ入力で比較します。同じSDKで、モデルとベースURLが異なります。
比較を実行するには、Apidogをダウンロードしてください。プロバイダーを切り替えてもコレクションがスムーズに移行することがポイントです。より広範なAPIテスト戦略については、QAエンジニアのためのAPIテストツールをご覧ください。

レート制限
xAIコンソールのティア制限は、ティア1の1分あたり数千リクエストから、エンタープライズティアの数十万リクエストまで変化します。具体的な数値は変動するため、コンソールダッシュボードを確認してください。xAIが宣伝する159トークン/秒のスループットは、集計ではなくストリームごとの出力速度であり、同時リクエストはティアの制限内で線形にスケーリングします。
レート制限に達した場合、APIはretry-afterヘッダーを含む429を返します。標準的な指数バックオフで処理されます。
よくある質問
- **Grok 4.3はOpenAIと完全に互換性がありますか?** Chat Completionsに関してははい。OpenAI SDKを組み込み、
base_urlを変更し、modelを変更するだけです。関数呼び出し、構造化出力、ストリーミングはすべて同じように機能します。 - **Responses APIをサポートしていますか?** 現在、xAIのインターフェースはChat Completionsです。Responses APIはOpenAI専用です。
- **実際のコンテキスト制限はどのくらいですか?** 1,000,000トークンです。長い入力は、100万トークンあたり1.25ドルであっても費用がかさむため、プロンプトが安定している場合は積極的にキャッシュしてください。
- **常時稼働の推論機能はレイテンシにどのように影響しますか?** 最初のトークンのレイテンシは非推論モデルよりもわずかに高くなりますが、Grok 4.3は出力が約159トークン/秒でストリーミングされるため、エンドツーエンドの応答時間は競争力があります。精度に敏感なワークロードでは、このトレードオフには価値があります。
- **Grok 4.3をGrok Voiceと連携して使用できますか?** はい。音声エージェント(
grok-voice-think-fast-1.0)は、推論時に内部でGrok 4.3を呼び出します。TTSおよびSTTプリミティブ上に構築した音声ループからGrok 4.3を直接呼び出すこともできます。 - **5月15日以降、古いGrok 3 / Grok 4への呼び出しはどうなりますか?** 410エラー(モデル廃止)で失敗します。期限までに移行してください。
- **Grok 4.3は画像入力をサポートしていますか?** はい、新しいビデオ入力と並行してサポートしています。OpenAIと同じ形式で、コンテンツブロックに画像URLを渡します。
まとめ
Grok 4.3は、xAIが発表した中で最も積極的な価格性能向上を実現したものです。40%の値下げ、100万トークンのコンテキスト、常時稼働の推論機能、およびネイティブビデオ機能が一体となり、ほとんどのエージェントワークロードにとって本格的な主力モデルとなります。OpenAI互換性により、移行はベースURLの変更だけで済み、書き直しは不要です。
最速の検証パスは、Apidogで3つの推論バリアントをスクリプト化し、実際のプロンプトを投入し、レイテンシと推論トークンを測定することです。5月15日までに移行してください。
