วิธีใช้ Grok 4.3 API

Ashley Innocent

Ashley Innocent

8 May 2026

วิธีใช้ Grok 4.3 API

enterprise.banner.title

enterprise.banner.feature1

enterprise.banner.feature2

enterprise.banner.feature3

enterprise.banner.ctaB

xAI ได้เปิดตัว Grok 4.3 เป็นระยะ: รุ่นเบต้าเมื่อวันที่ 17 เมษายน 2026, การเข้าถึง API ในวันที่ 30 เมษายน และการเปิดใช้งานทั่วไปเต็มรูปแบบในวันที่ 6 พฤษภาคม จุดเด่นคือ: หน้าต่างบริบทขนาด 1,000,000 โทเค็น, การป้อนวิดีโอแบบเนทีฟเป็นครั้งแรกสำหรับ Grok, การให้เหตุผลตลอดเวลา, และการลดราคาลงประมาณ 40% เมื่อเทียบกับ Grok 4.20 โมเดล Grok รุ่นเก่าแปดรุ่นจะปลดระวางในวันที่ 15 พฤษภาคม ดังนั้นใครก็ตามที่ใช้ซีรีส์ grok-3 หรือ grok-4 ควรวางแผนการโยกย้ายในสัปดาห์นี้

คู่มือนี้ครอบคลุมวิธีการเรียกใช้ Grok 4.3 จากโค้ดของคุณ: รูปแบบของเอนด์พอยต์, การยืนยันตัวตน, URL พื้นฐานที่เข้ากันได้กับ OpenAI, พารามิเตอร์ความพยายามในการให้เหตุผล, การป้อนวิดีโอ, การเรียกใช้ฟังก์ชัน และการตั้งค่าการทดสอบที่ใช้งานได้ใน Apidog

สำหรับการใช้งานด้านเสียงของการเปิดตัวเดียวกัน โปรดดู วิธีการใช้ Grok Voice ฟรี สำหรับการเปรียบเทียบกับโมเดลเสียงเรือธงของ OpenAI โปรดดู Grok Voice vs GPT-Realtime

ปุ่ม

TL;DR

มีอะไรเปลี่ยนไปใน Grok 4.3 บ้าง

การอัปเกรดที่สำคัญ เรียงตามลำดับผลกระทบต่อทีมส่วนใหญ่:

ดัชนีความฉลาดที่ 53 (การวิเคราะห์โดยปัญญาประดิษฐ์) ทำให้ Grok 4.3 สูงกว่าค่าเฉลี่ย 35 สำหรับระดับราคาเดียวกัน และอยู่ในอันดับที่สิบจาก 146 โมเดลที่ติดตาม

ข้อกำหนดเบื้องต้น

ก่อนคำขอแรก ให้เตรียมสี่สิ่งนี้:

ส่งออกคีย์เพียงครั้งเดียว:

export XAI_API_KEY="xai-..."

เอนด์พอยต์และการยืนยันตัวตน

Grok 4.3 ใช้งานได้บนอินเทอร์เฟซ Chat Completions ที่เข้ากันได้กับ OpenAI โดยใช้ URL พื้นฐานของ xAI

POST https://api.x.ai/v1/chat/completions

การยืนยันตัวตนใช้ bearer token เฮดเดอร์เป็นแบบมาตรฐาน:

Authorization: Bearer $XAI_API_KEY
Content-Type: application/json

ความเข้ากันได้กับ OpenAI หมายความว่าคุณสามารถใช้ OpenAI Python หรือ Node SDK และเปลี่ยน base_url ได้ นี่เป็นเส้นทางที่ง่ายที่สุดสำหรับทีมส่วนใหญ่ที่ย้ายจาก gpt-4 หรือ gpt-5

from openai import OpenAI

client = OpenAI(
    api_key=os.environ["XAI_API_KEY"],
    base_url="https://api.x.ai/v1",
)

response = client.chat.completions.create(
    model="grok-4.3",
    messages=[
        {"role": "user", "content": "Summarize the trade-offs of GraphQL vs REST in three bullets."}
    ],
    reasoning_effort="medium",
)

print(response.choices[0].message.content)

หากคุณต้องการใช้ xAI SDK รูปแบบการเรียกใช้จะเหมือนกัน การเปลี่ยนแปลงเพียงอย่างเดียวคือการ import

พารามิเตอร์คำขอ

แผนที่พารามิเตอร์ทั้งหมดสำหรับ Grok 4.3:

พารามิเตอร์ ชนิด ค่า หมายเหตุ
model string grok-4.3 จำเป็น
messages array รูปแบบข้อความของ OpenAI จำเป็น รองรับ role: system / user / assistant
reasoning_effort string low, medium, high ไม่บังคับ ค่าเริ่มต้น: medium ระดับที่สูงขึ้นจะเพิ่มความหน่วงเวลาและโทเค็นเอาต์พุต
max_tokens int 1–32768 จำกัดเอาต์พุต
temperature float 0.0–2.0 ค่าเริ่มต้น 1.0
top_p float 0.0–1.0 การสุ่มตัวอย่างแบบ Nucleus
stream bool true / false เหตุการณ์ที่ส่งจากเซิร์ฟเวอร์เมื่อเป็นจริง
tools array รูปแบบเครื่องมือของ OpenAI การเรียกใช้ฟังก์ชัน
tool_choice string / object auto, none, หรือเครื่องมือที่ระบุ ความหมายตามมาตรฐาน OpenAI
response_format object { type: "json_object" } เอาต์พุตที่มีโครงสร้าง
seed int ใดๆ เพื่อความสามารถในการทำซ้ำที่ temperature: 0

คำขอ curl ที่ใช้งานได้:

curl https://api.x.ai/v1/chat/completions \
  -H "Authorization: Bearer $XAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-4.3",
    "messages": [
      {"role": "system", "content": "You are a senior backend engineer."},
      {"role": "user", "content": "Review this query plan and flag the bottleneck."}
    ],
    "reasoning_effort": "high"
  }'

การตอบกลับมีรูปแบบมาตรฐานของ OpenAI: choices[].message.content พร้อมด้วยอ็อบเจกต์ usage ที่แยกรายละเอียดของ prompt_tokens, completion_tokens, reasoning_tokens, และ total_tokens

ความพยายามในการให้เหตุผล

สามระดับ พร้อมคำแนะนำที่ชัดเจน:

การให้เหตุผลตลอดเวลาหมายความว่าแม้แต่ low ก็ยังมีการคิดบางอย่าง ซึ่งเป็นปัจจัยที่ทำให้ความแม่นยำของข้อเท็จจริงเพิ่มขึ้นเมื่อเทียบกับ Grok 4.20 อย่าคาดหวังว่าจะประหยัดเงินด้วยการหลีกเลี่ยงการให้เหตุผลทั้งหมด เพราะมันถูกฝังอยู่แล้ว

การเรียกใช้ฟังก์ชัน

รูปแบบมาตรฐานของ OpenAI สามารถใช้งานได้โดยตรง ประกาศเครื่องมือ, โมเดลจะส่งอาร์เรย์ tool_calls ในข้อความผู้ช่วย, คุณดำเนินการ, และคุณตอบกลับด้วยข้อความ tool role:

tools = [{
    "type": "function",
    "function": {
        "name": "lookup_user",
        "description": "Look up a user by ID.",
        "parameters": {
            "type": "object",
            "properties": {"user_id": {"type": "string"}},
            "required": ["user_id"],
        },
    },
}]

response = client.chat.completions.create(
    model="grok-4.3",
    messages=[{"role": "user", "content": "Find user u_42 and tell me their last login."}],
    tools=tools,
    reasoning_effort="medium",
)

tool_calls = response.choices[0].message.tool_calls

การเพิ่มขึ้น 300 Elo บน GDPval-AA แสดงให้เห็นที่นี่ในการใช้งานจริง; Grok 4.3 เลือกเครื่องมือได้ดีขึ้น, มีการเรียกใช้ที่ซ้ำซ้อนน้อยลง, และสามารถกู้คืนจากข้อผิดพลาดของเครื่องมือได้โดยไม่ติดขัด หากคุณกำลังทดสอบโฟลว์เครื่องมือ การทดสอบเซิร์ฟเวอร์ MCP ใน Apidog ครอบคลุมการตั้งค่าการเล่นซ้ำที่เราใช้ภายในองค์กร

การป้อนวิดีโอ

Grok 4.3 เป็นโมเดล Grok รุ่นแรกที่รองรับการป้อนวิดีโอแบบเนทีฟ ส่ง URL วิดีโอภายในบล็อกเนื้อหา:

response = client.chat.completions.create(
    model="grok-4.3",
    messages=[{
        "role": "user",
        "content": [
            {"type": "text", "text": "Describe what happens in this clip and flag any anomalies."},
            {"type": "video_url", "video_url": {"url": "https://example.com/clip.mp4"}},
        ],
    }],
)

โทเค็นวิดีโอจะนับรวมในมิเตอร์อินพุต คลิปที่ยาวจะใช้บริบทอย่างรวดเร็ว; ให้ลดขนาดหรือตัดแต่งก่อนส่งหากต้นทุนเป็นเรื่องสำคัญ โมเดลจะให้เหตุผลบนเฟรมวิดีโอโดยตรง คุณจึงไม่จำเป็นต้องดึงคีย์เฟรมด้วยตนเอง

บริบท 1 ล้านโทเค็น

หน้าต่างบริบท 1 ล้านโทเค็นเป็นเครื่องมือสำหรับการใช้งานจริง ไม่ใช่เพียงแค่รางวัลจากการทดสอบ รูปแบบการใช้งานทั่วไป:

อินพุตที่แคชไว้ในราคา $0.20/1M ทำให้ราคานี้เข้าถึงได้ พร้อมท์ระบบขนาด 400k โทเค็นที่คุณเก็บไว้อย่างเสถียรจะใช้เงิน $0.08 ต่อการเรียกใช้แบบแคช แทนที่จะเป็น $0.50 สำหรับการเรียกใช้ใหม่

การโยกย้ายจากโมเดล Grok รุ่นเก่า

โมเดล Grok รุ่นเก่าแปดรุ่นจะปลดระวางในวันที่ 15 พฤษภาคม 2026, เวลา 12:00 น. PT หากคุณกำลังใช้งานโมเดลใดๆ เหล่านั้น ให้เปลี่ยนสตริง model เป็น grok-4.3 ก่อนถึงกำหนดเวลา การเรียกใช้งานส่วนใหญ่จะทำงานได้โดยไม่ต้องเปลี่ยนแปลงเพิ่มเติม เนื่องจากรูปแบบคำขอไม่เปลี่ยนแปลง

สองสิ่งที่คุณควรระวัง:

สำหรับการเปรียบเทียบราคาเต็มของผลิตภัณฑ์ OpenAI โปรดดู ราคา GPT-5.5; สำหรับโมเดลการให้เหตุผลแบบตัวต่อตัว โปรดดู วิธีการใช้ GPT-5.5 API

การทดสอบใน Apidog

วิธีการตรวจสอบ Grok 4.3 กับกรณีการใช้งานของคุณที่เร็วที่สุด:

  1. สร้างสภาพแวดล้อม Apidog ด้วย XAI_API_KEY และ BASE_URL = https://api.x.ai/v1
  2. บันทึกคอลเล็กชันคำขอที่มีสามรูปแบบ: low, medium, high สำหรับการให้เหตุผล ใช้พร้อมท์เดียวกัน แต่ระดับความพยายามต่างกัน
  3. รันทั้งสามแบบ เปรียบเทียบการตอบกลับ, ความหน่วงเวลา, และจำนวน usage.reasoning_tokens เคียงข้างกัน
  4. เพิ่มรูปแบบที่สี่ที่ชี้ไปยัง URL พื้นฐานของ OpenAI เพื่อเปรียบเทียบ Grok 4.3 กับ GPT-5.5 บนอินพุตเดียวกัน ใช้ SDK เดียวกัน แต่โมเดลและ URL พื้นฐานต่างกัน

ดาวน์โหลด Apidog เพื่อทำการเปรียบเทียบ คอลเล็กชันสามารถย้ายได้ง่ายเมื่อคุณเปลี่ยนผู้ให้บริการ ซึ่งเป็นจุดประสงค์หลัก สำหรับกลยุทธ์การทดสอบ API ที่กว้างขึ้น โปรดดู เครื่องมือทดสอบ API สำหรับวิศวกร QA

การจำกัดอัตรา (Rate limits)

การจำกัดระดับใน xAI Console เริ่มต้นจากพื้นฐานไม่กี่พันคำขอต่อนาทีใน Tier 1 ไปจนถึงหลายแสนคำขอในระดับองค์กร (enterprise tiers) ตัวเลขที่แน่นอนอาจมีการเปลี่ยนแปลง; โปรดตรวจสอบแดชบอร์ดของคอนโซล ทรูพุต 159 โทเค็น/วินาทีที่ xAI โฆษณาเป็นความเร็วเอาต์พุตต่อสตรีม ไม่ใช่รวมทั้งหมด; คำขอพร้อมกันจะปรับขนาดเป็นเชิงเส้นภายในขีดจำกัดของระดับ

หากคุณติดขีดจำกัดอัตรา (rate limits) API จะคืนค่า 429 พร้อมเฮดเดอร์ retry-after ซึ่งสามารถจัดการได้ด้วยกลไก exponential backoff มาตรฐาน

คำถามที่พบบ่อย

Grok 4.3 เข้ากันได้กับ OpenAI ทั้งหมดหรือไม่? สำหรับ Chat Completions ใช่ ใส่ OpenAI SDK, เปลี่ยน base_url, เปลี่ยน model การเรียกใช้ฟังก์ชัน, เอาต์พุตที่มีโครงสร้าง และการสตรีมทั้งหมดทำงานเหมือนกัน

รองรับ Responses API หรือไม่? อินเทอร์เฟซของ xAI ในวันนี้คือ Chat Completions Responses API เป็นของ OpenAI เท่านั้น

ขีดจำกัดบริบทที่แท้จริงในการใช้งานจริงคือเท่าใด? 1,000,000 โทเค็น อินพุตที่ยาวมีค่าใช้จ่ายจริงแม้ในราคา $1.25/1M; ให้แคชอย่างจริงจังหากพร้อมท์ของคุณเสถียร

การให้เหตุผลตลอดเวลามีผลต่อความหน่วงเวลาอย่างไร? ความหน่วงเวลาของโทเค็นแรกจะสูงกว่าโมเดลที่ไม่ใช้การให้เหตุผลเล็กน้อย แต่ Grok 4.3 สตรีมเอาต์พุตที่ประมาณ 159 โทเค็น/วินาที ดังนั้นเวลาตอบสนองตั้งแต่ต้นจนจบจึงสามารถแข่งขันได้ การแลกเปลี่ยนนี้คุ้มค่าสำหรับงานที่ต้องการความแม่นยำสูง

ฉันสามารถใช้ Grok 4.3 ร่วมกับ Grok Voice ได้หรือไม่? ได้ ตัวแทนเสียง (grok-voice-think-fast-1.0) จะเรียก Grok 4.3 อยู่เบื้องหลังเมื่อมีการให้เหตุผล คุณยังสามารถเรียก Grok 4.3 ได้โดยตรงจากวงจรเสียงที่คุณสร้างขึ้นบนพื้นฐานของ TTS และ STT

จะเกิดอะไรขึ้นกับการเรียกใช้ Grok 3 / Grok 4 เดิมของฉันหลังจากวันที่ 15 พฤษภาคม? จะล้มเหลวด้วยรหัส 410 (โมเดลถูกปลดระวาง) กรุณาโยกย้ายก่อนถึงกำหนด

Grok 4.3 รองรับการป้อนรูปภาพหรือไม่? ใช่ นอกจากการป้อนวิดีโอใหม่แล้ว ส่ง URL รูปภาพในบล็อกเนื้อหา รูปแบบเดียวกับ OpenAI

สรุป

Grok 4.3 เป็นการเคลื่อนไหวด้านราคาและประสิทธิภาพที่ก้าวร้าวที่สุดที่ xAI ได้เปิดตัว การลดราคา 40%, บริบท 1 ล้านโทเค็น, การให้เหตุผลตลอดเวลา, และวิดีโอแบบเนทีฟ ทำให้เป็นเครื่องมือประจำวันที่สำคัญสำหรับงาน agent ส่วนใหญ่ ความเข้ากันได้กับ OpenAI หมายถึงการโยกย้ายคือการเปลี่ยน URL พื้นฐาน ไม่ใช่การเขียนใหม่ทั้งหมด

วิธีการตรวจสอบที่เร็วที่สุด: สร้างสคริปต์การให้เหตุผลสามรูปแบบใน Apidog ใส่พร้อมท์จริงของคุณ วัดความหน่วงเวลาและโทเค็นการให้เหตุผล โยกย้ายก่อนวันที่ 15 พฤษภาคม

ปุ่ม

ฝึกการออกแบบ API แบบ Design-first ใน Apidog

ค้นพบวิธีที่ง่ายขึ้นในการสร้างและใช้ API