Qwen3.6-Plus API: ชนะ Claude บน Terminal Benchmarks

Ashley Innocent

Ashley Innocent

2 April 2026

Qwen3.6-Plus API: ชนะ Claude บน Terminal Benchmarks

Apidog สำหรับองค์กร

การติดตั้งแบบ On-Premises

SSO & RBAC

รองรับมาตรฐาน SOC 2

สำรวจ Apidog Enterprise

สรุป (TL;DR)

Qwen3.6-Plus ได้เปิดตัวอย่างเป็นทางการแล้ว โดยทำคะแนนได้ 78.8% ใน SWE-bench Verified และ 61.6% ใน Terminal-Bench 2.0 ซึ่งสูงกว่า Claude Opus 4.5 มี Context Window ขนาด 1M โทเค็น, พารามิเตอร์ใหม่ชื่อ preserve_thinking สำหรับ Agent Loops และทำงานร่วมกับ Claude Code, OpenClaw และ Qwen Code ได้โดยตรงผ่าน API ที่เข้ากันได้กับ OpenAI

จากการพรีวิวสู่การเปิดตัว

หากคุณได้อ่าน คู่มือฉบับก่อนหน้าของเราเกี่ยวกับ Qwen 3.6 Plus Preview บน OpenRouter คุณก็คงจะทราบถึงความสามารถของโมเดลนี้อยู่แล้ว การพรีวิวได้เปิดตัวอย่างเงียบๆ เมื่อวันที่ 30 มีนาคม โดยไม่ต้องรอคิวและเข้าถึงได้ฟรีผ่าน OpenRouter ในสองวันแรก โมเดลนี้ได้ประมวลผลโทเค็นการสร้างข้อความไปกว่า 400 ล้านโทเค็น จากคำขอประมาณ 400,000 รายการ

การเปิดตัวอย่างเป็นทางการนำมาซึ่งเวอร์ชันสำหรับการผลิตเต็มรูปแบบ ไม่ใช่แค่เวอร์ชันพรีวิวอีกต่อไป ตอนนี้โมเดลพร้อมใช้งานแล้วผ่าน Alibaba Cloud Model Studio พร้อม API ที่เสถียร, การรับประกันความพร้อมใช้งาน (SLA-backed uptime) และพารามิเตอร์ API ใหม่ที่ทำให้มีความสามารถในการทำงานสำหรับงานเอเจนต์แบบหลายขั้นตอนเพิ่มขึ้นอย่างมาก

คู่มือนี้ครอบคลุมถึงสิ่งที่เปลี่ยนแปลง วิธีเรียกใช้ API อย่างถูกต้อง และวิธีทดสอบการผสานรวมของคุณกับ Apidog ก่อนการปรับใช้

ปุ่ม

Qwen3.6-Plus คืออะไร

Qwen3.6-Plus เป็นโมเดล Mixture-of-Experts ที่โฮสต์โดยทีม Qwen ของ Alibaba เช่นเดียวกับซีรีส์ Qwen3.5 โมเดลนี้ใช้ Sparse Activation ซึ่งหมายความว่ามีเพียงส่วนเล็กๆ ของพารามิเตอร์เท่านั้นที่ทำงานต่อโทเค็น ผลลัพธ์คือประสิทธิภาพที่แข็งแกร่งด้วยต้นทุนการประมวลผลที่ต่ำกว่าโมเดล Dense ที่มีความสามารถใกล้เคียงกัน

คุณสมบัติหลักเมื่อเปิดตัว:

เวอร์ชัน Open-source ขนาดเล็กกว่ากำลังจะเปิดตัวในไม่กี่วัน หากคุณต้องการ Weights สำหรับการโฮสต์เอง ก็กำลังจะมาถึง

ผลลัพธ์ Benchmark

Coding Agents

Qwen3.6-Plus ตามหลัง Claude Opus 4.5 เพียงเล็กน้อยในงาน SWE-bench ส่วนใหญ่ แต่สามารถเอาชนะทุกโมเดลในการเปรียบเทียบในส่วนของการดำเนินการในเทอร์มินัล

Terminal-Bench 2.0 ทดสอบการดำเนินการเชลล์จริง: การจัดการไฟล์, การควบคุมกระบวนการ, การทำงานเวิร์กโฟลว์เทอร์มินัลแบบหลายขั้นตอนภายใต้ระยะเวลา 3 ชั่วโมง โดยใช้ 32 คอร์ CPU และ RAM 48GB การที่ Qwen3.6-Plus ทำคะแนนได้ 61.6% เทียบกับ Claude Opus 4.5 ที่ 59.3% ถือเป็นช่องว่างที่มีนัยสำคัญในงานประเภทที่นักพัฒนาใช้งานจริง

General Agents และการใช้เครื่องมือ

Benchmark Claude Opus 4.5 Qwen3.6-Plus
TAU3-Bench 70.2% 70.7%
DeepPlanning 33.9% 41.5%
MCPMark 42.3% 48.2%
MCP-Atlas 71.8% 74.1%
WideSearch 76.4% 74.3%

MCPMark ทดสอบการเรียกใช้เครื่องมือ GitHub MCP v0.30.3 โดยมีการตัดการตอบสนองของ Playwright ที่ 32K โทเค็น การเป็นผู้นำที่ 48.2% มีความสำคัญสำหรับผู้ที่พัฒนาเครื่องมือที่ใช้ MCP DeepPlanning ที่ 41.5% เทียบกับ 33.9% ของ Claude แสดงให้เห็นถึงช่องว่างที่สำคัญในงานวางแผนระยะยาว

การใช้เหตุผลและความรู้

Benchmark Claude Opus 4.5 Qwen3.6-Plus
GPQA 87.0% 90.4%
LiveCodeBench v6 84.8% 87.1%
IFEval strict 90.9% 94.3%
MMLU-Pro 89.5% 88.5%

GPQA เป็น Benchmark การใช้เหตุผลทางวิทยาศาสตร์ระดับบัณฑิตศึกษา IFEval strict วัดว่าโมเดลปฏิบัติตามคำแนะนำรูปแบบและข้อจำกัดที่แม่นยำได้ดีเพียงใด Qwen3.6-Plus เป็นผู้นำทั้งสอง ซึ่งสำคัญสำหรับการสร้างเอาต์พุตที่มีโครงสร้างและงานที่ต้องใช้ Agent ซึ่งโมเดลต้องปฏิบัติตามคำแนะนำที่ซับซ้อนโดยไม่หลุดประเด็น

Multimodal

Qwen3.6-Plus เป็นโมเดล Multimodal แบบเนทีฟ มันเป็นผู้นำในหลาย Benchmark ด้านการทำความเข้าใจเอกสาร, การประมวลผลเชิงพื้นที่ และการตรวจจับวัตถุ

Benchmark Qwen3.6-Plus หมายเหตุ
OmniDocBench 1.5 91.2% อันดับสูงสุดในตาราง
RefCOCO avg 93.5% อันดับสูงสุดในตาราง
We-Math 89.0% อันดับสูงสุดในตาราง
CountBench 97.6% อันดับสูงสุดในตาราง
OSWorld-Verified 62.5% ตามหลัง Claude (66.3%)

OSWorld-Verified ซึ่งเป็น Benchmark การใช้งานคอมพิวเตอร์เดสก์ท็อป โดย Claude Opus 4.5 นำอยู่ที่ 66.3% เทียบกับ Qwen3.6-Plus ที่ 62.5% สำหรับงานการทำความเข้าใจเอกสารและงานระบุตำแหน่งเชิงพื้นที่ Qwen3.6-Plus เป็นผู้นำ

วิธีเรียกใช้ API

Qwen3.6-Plus มีอยู่บน Alibaba Cloud Model Studio รับ API key ของคุณได้ที่ modelstudio.alibabacloud.com

URL พื้นฐานสามภูมิภาค:

การเรียกใช้พื้นฐานพร้อม Streaming

from openai import OpenAI
import os

client = OpenAI(
 api_key=os.environ["DASHSCOPE_API_KEY"],
 base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

completion = client.chat.completions.create(
 model="qwen3.6-plus",
 messages=[{"role": "user", "content": "Review this Python function and find bugs."}],
 extra_body={"enable_thinking": True},
 stream=True
)

reasoning = ""
answer = ""
is_answering = False

for chunk in completion:
 if not chunk.choices:
 continue
 delta = chunk.choices[0].delta
 if hasattr(delta, "reasoning_content") and delta.reasoning_content:
 if not is_answering:
 reasoning += delta.reasoning_content
 if delta.content:
 if not is_answering:
 is_answering = True
 answer += delta.content
 print(delta.content, end="", flush=True)

พารามิเตอร์ preserve_thinking

เวอร์ชันพรีวิวเก็บเฉพาะการใช้เหตุผลจากการตอบกลับปัจจุบันเท่านั้น การเปิดตัวอย่างเป็นทางการเพิ่ม preserve_thinking เข้ามา

เมื่อคุณตั้งค่า preserve_thinking: true โมเดลจะคง Chain-of-Thought จากการสนทนาก่อนหน้าทั้งหมดไว้ Alibaba แนะนำสิ่งนี้เป็นพิเศษสำหรับสถานการณ์ที่ต้องใช้ Agent เหตุผลคือ: Agent ที่ทำงานผ่านงานหลายขั้นตอนจะได้รับประโยชน์จากการได้เห็นแนวคิดก่อนหน้าของตัวเอง ทำให้ตัดสินใจได้ดีขึ้นในขั้นตอนที่ 5 เมื่อสามารถเห็นได้ว่าทำไมถึงเลือกเช่นนั้นในขั้นตอนที่ 2

คุณสมบัตินี้ถูกปิดใช้งานโดยค่าเริ่มต้นเพื่อควบคุมการใช้โทเค็น เปิดใช้งานสำหรับ Agent loops

completion = client.chat.completions.create(
 model="qwen3.6-plus",
 messages=conversation_history,
 extra_body={
 "enable_thinking": True,
 "preserve_thinking": True, # keep reasoning across all turns
 },
 stream=True
)

ใช้ Qwen3.6-Plus กับ Claude Code

Qwen API รองรับโปรโตคอล Anthropic คุณสามารถรัน Claude Code กับ Qwen3.6-Plus ได้โดยไม่ต้องเปลี่ยนการกำหนดค่า Claude Code ใดๆ นอกเหนือจากตัวแปรสภาพแวดล้อม

npm install -g @anthropic-ai/claude-code

export ANTHROPIC_MODEL="qwen3.6-plus"
export ANTHROPIC_SMALL_FAST_MODEL="qwen3.6-plus"
export ANTHROPIC_BASE_URL=https://dashscope-intl.aliyuncs.com/apps/anthropic
export ANTHROPIC_AUTH_TOKEN=your_dashscope_api_key

claude

ใช้ Qwen3.6-Plus กับ OpenClaw

OpenClaw (เดิมชื่อ Moltbot / Clawdbot) เป็น Agent เขียนโค้ดแบบ Open-source ที่โฮสต์เอง ติดตั้งและชี้ไปที่ Model Studio:

# ติดตั้ง (Node.js 22+)
curl -fsSL https://molt.bot/install.sh | bash

export DASHSCOPE_API_KEY=your_key
openclaw dashboard

แก้ไข ~/.openclaw/openclaw.json และรวมฟิลด์เหล่านี้ (อย่าเขียนทับไฟล์ทั้งหมด):

{
 "models": {
 "providers": [{
 "name": "alibaba-coding-plan",
 "baseUrl": "https://coding-intl.dashscope.aliyuncs.com/v1",
 "apiKey": "${DASHSCOPE_API_KEY}",
 "models": [{"id": "qwen3.6-plus", "reasoning": true}]
 }]
 },
 "agents": {
 "defaults": {"models": ["qwen3.6-plus"]}
 }
}

ใช้ Qwen3.6-Plus กับ Qwen Code

Qwen Code เป็น Agent เทอร์มินัลแบบ Open-source ของ Alibaba เอง ที่สร้างขึ้นมาโดยเฉพาะสำหรับซีรีส์ Qwen ซึ่งให้คุณใช้ API ได้ฟรี 1,000 ครั้งต่อวันเมื่อคุณลงชื่อเข้าใช้ด้วย Qwen Code OAuth

npm install -g @qwen-code/qwen-code@latest
qwen
# พิมพ์ /auth เพื่อลงชื่อเข้าใช้และเปิดใช้งาน Free Tier

เหตุใด preserve_thinking จึงเปลี่ยนแปลงพฤติกรรมของ Agent

API ของ LLM ส่วนใหญ่ปฏิบัติต่อแต่ละรอบ (turn) แยกจากกัน โมเดลจะสร้างคำตอบ การใช้เหตุผลจะถูกละทิ้ง และรอบถัดไปจะเริ่มต้นใหม่ สำหรับการถามตอบง่ายๆ ก็ไม่มีปัญหา แต่สำหรับ Agent ที่ทำงาน 10-20 ขั้นตอน จะสร้างปัญหา: โมเดลไม่สามารถเห็นเหตุผลที่ตัดสินใจในตอนแรก ทำให้หลุดประเด็น

พารามิเตอร์ preserve_thinking จะเก็บ Chain-of-Reasoning ทั้งหมดจากการสนทนาก่อนหน้าให้มองเห็นได้เมื่อสร้างการตอบกลับถัดไป ผลลัพธ์ที่เป็นรูปธรรม: Agent ที่ทำงานผ่านงานระดับ Repository ที่ซับซ้อนในขั้นตอนที่ 8 สามารถเห็นการวิเคราะห์จากขั้นตอนที่ 2, 4 และ 6 ได้ ทำให้ตัดสินใจได้สอดคล้องกันมากขึ้นและสร้างความขัดแย้งน้อยลง

ผลการ Benchmark ของ Alibaba แสดงให้เห็นว่าสิ่งนี้ยังช่วยลดการใช้เหตุผลซ้ำซ้อนอีกด้วย เมื่อโมเดลไม่ต้องสร้างบริบทที่เคยสร้างไว้แล้วซ้ำอีก จะใช้โทเค็นต่อรอบน้อยลงโดยเฉลี่ยสำหรับเวิร์กโฟลว์หลายขั้นตอนที่ซับซ้อน

ใช้รูปแบบนี้สำหรับ Agent loops:

conversation = []

def agent_step(user_message, preserve=True):
    conversation.append({"role": "user", "content": user_message})

    response = client.chat.completions.create(
        model="qwen3.6-plus",
        messages=conversation,
        extra_body={
            "enable_thinking": True,
            "preserve_thinking": preserve,
        },
        stream=False
    )

    message = response.choices[0].message
    conversation.append({"role": "assistant", "content": message.content})
    return message.content

# ตัวอย่าง: Agent ตรวจสอบโค้ดแบบหลายขั้นตอน
result = agent_step("Analyze the auth module for security issues.")
result = agent_step("Now suggest fixes for the top 3 issues you found.")
result = agent_step("Write tests that validate each fix.")

หากไม่มี preserve_thinking โมเดลในขั้นตอนที่ 3 จะไม่ทราบว่าระบุปัญหา 3 ข้อใดในขั้นตอนที่ 1 แต่เมื่อมีพารามิเตอร์นี้ Chain-of-Reasoning ก็จะยังคงอยู่ครบถ้วน

เหมาะสำหรับอะไรมากที่สุด

การแก้ไขข้อบกพร่องระดับ Repository. SWE-bench Verified ที่ 78.8% และ SWE-bench Pro ที่ 56.6% สามารถแข่งขันกับโมเดลใดๆ ที่มีอยู่ในปัจจุบันได้ หากคุณกำลังใช้งานระบบซ่อมแซมหรือตรวจสอบโค้ดอัตโนมัติ Qwen3.6-Plus คุ้มค่าที่จะนำมาเปรียบเทียบกับระบบปัจจุบันของคุณ

ระบบอัตโนมัติสำหรับเทอร์มินัล. ความเป็นผู้นำใน Terminal-Bench 2.0 ทำให้เป็นโมเดลที่แข็งแกร่งที่สุดสำหรับการทำงานที่เน้น Shell เป็นหลัก เช่น การจัดการไฟล์หลายขั้นตอน, การควบคุมกระบวนการ, Build pipelines

การเรียกใช้เครื่องมือ MCP. MCPMark ที่ 48.2% (ผลลัพธ์สูงสุด) ทำให้เป็นตัวเลือกที่ดีที่สุดสำหรับการผสานรวมเครื่องมือที่ใช้ MCP ในปัจจุบัน

การวิเคราะห์เอกสารแบบ Long-context. Context Window ขนาด 1M โทเค็นพร้อมคะแนน LongBench v2 ที่แข็งแกร่ง รองรับการตรวจสอบ Codebase เต็มรูปแบบ, เอกสารข้อกำหนดขนาดใหญ่ และการวิเคราะห์ไฟล์หลายไฟล์ในการเรียกครั้งเดียว

การสร้างโค้ดส่วนหน้า (Frontend code generation). QwenWebBench ภายในทีม Qwen (การจัดอันดับ Elo, 7 หมวดหมู่: Web Design, Web Apps, Games, SVG, Data Visualization, Animation, 3D) ให้คะแนน Qwen3.6-Plus ที่ 1501.7 เทียบกับ Claude Opus 4.5 ที่ 1517.9 ซึ่งเทียบเท่ากันในด้านคุณภาพการสร้าง Frontend

หลายภาษา (Multilingual). WMT24++ ที่ 84.3% (สูงสุด), MAXIFE ที่ 88.2% ครอบคลุม 23 ภาษา แข็งแกร่งในกรณีการใช้งานที่ไม่ใช่ภาษาอังกฤษ

การทดสอบการเรียกใช้ API ของ Qwen3.6-Plus ด้วย Apidog

Endpoint เข้ากันได้กับ OpenAI ดังนั้นคุณสามารถนำเข้าโดยตรงไปยัง Apidog และทดสอบได้เหมือน API อื่นๆ

ตั้งค่าคำขอ POST ไปยัง https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions เพิ่ม API key ของคุณเป็นตัวแปรสภาพแวดล้อม: Authorization: Bearer {{DASHSCOPE_API_KEY}}

เขียน Assertion การตอบกลับเพื่อตรวจสอบโครงสร้างและเนื้อหา:

pm.test("Response contains choices", () => {
 const body = pm.response.json();
 pm.expect(body).to.have.property("choices");
 pm.expect(body.choices[0].message.content).to.be.a("string").and.not.empty;
});

pm.test("No empty reasoning when thinking enabled", () => {
 const choice = pm.response.json().choices[0];
 if (choice.message.reasoning_content !== undefined) {
 pm.expect(choice.message.reasoning_content).to.not.be.empty;
 }
});

ใช้ Smart Mock ของ Apidog เพื่อสร้างการตอบกลับทดสอบระหว่างการพัฒนา ซึ่งหมายความว่าโค้ดการจัดเรียง Agent ของคุณสามารถทดสอบได้โดยไม่ต้องเรียกใช้ API จริงทุกครั้ง ช่วยประหยัดโทเค็นและทำให้รอบการทดสอบรวดเร็ว

หากคุณกำลังสร้าง Agent แบบหลายรอบ ให้สร้าง Test Scenario ใน Apidog ที่เชื่อมโยงคำขอหลายรายการเข้าด้วยกัน ตรวจสอบว่า preserve_thinking ยังคงรักษาการใช้เหตุผลข้ามรอบโดยการตรวจสอบโครงสร้างการตอบกลับในแต่ละขั้นตอนก่อนที่คุณจะรัน Loop เต็มรูปแบบในการผลิต

ดาวน์โหลด Apidog ฟรี เพื่อตั้งค่าการทดสอบเหล่านี้

มีอะไรกำลังจะมา

ทีม Qwen ยืนยันว่าเวอร์ชัน Open-source ที่มีขนาดเล็กกว่าจะเปิดตัวในอีกไม่กี่วัน ซึ่งจะตามรูปแบบของ Qwen3.5: โมเดล MoE แบบ Sparse พร้อม Weights สาธารณะแบบ Apache 2.0

Roadmap ยังรวมถึง:

เวอร์ชัน Open-source ของ Qwen3.5 กลายเป็นหนึ่งในโมเดลที่โฮสต์เองที่มีการใช้งานมากที่สุดภายในไม่กี่สัปดาห์หลังจากการเปิดตัว หาก Qwen3.6 เป็นไปตามรูปแบบเดียวกัน เวอร์ชันขนาดเล็กกว่าน่าจะเป็นตัวเลือกเริ่มต้นสำหรับ Agent เขียนโค้ดที่โฮสต์เองในไม่ช้าหลังจากเปิดตัว

สรุป

Qwen3.6-Plus ได้ลดช่องว่างกับ Claude Opus 4.5 ในงานเขียนโค้ด และเป็นผู้นำอย่างชัดเจนในการดำเนินการในเทอร์มินัล, การเรียกใช้เครื่องมือ MCP และการวางแผนระยะยาว Context Window ขนาด 1M โทเค็น, ความเข้ากันได้ของโปรโตคอล Anthropic และ preserve_thinking สำหรับ Agent Loops ทำให้เป็นตัวเลือกที่ใช้งานได้จริงสำหรับระบบ Agentic ที่ใช้ในการผลิตในขณะนี้

ช่วงพรีวิวฟรีบน OpenRouter เป็นวิธีที่มีประโยชน์ในการประเมินโมเดล API อย่างเป็นทางการนำมาซึ่งความเสถียร, การรับประกัน SLA และพารามิเตอร์ใหม่ที่เน้น Agent ซึ่งทำให้เวิร์กโฟลว์หลายรอบมีความน่าเชื่อถือมากขึ้น

Apidog จัดการด้านการทดสอบ: นำเข้า Endpoint ที่เข้ากันได้กับ OpenAI, เขียน Assertion การตอบกลับ, Mock ระหว่างการพัฒนา และรัน Regression Tests เมื่อใดก็ตามที่คุณอัปเดตโมเดลหรืออัปเดตเวอร์ชัน API

ปุ่ม

คำถามที่พบบ่อย

Qwen3.6-Plus และเวอร์ชันพรีวิวแตกต่างกันอย่างไร?เวอร์ชันพรีวิว (qwen/qwen3.6-plus-preview) เปิดตัวบน OpenRouter เมื่อวันที่ 30 มีนาคม 2026 การเปิดตัวอย่างเป็นทางการได้เพิ่มพารามิเตอร์ preserve_thinking, การรับประกันความพร้อมใช้งาน (SLA-backed uptime) และการรองรับ Model Studio เต็มรูปแบบ นอกจากนี้ เวอร์ชัน Open-source ขนาดเล็กกว่าก็กำลังจะมา

preserve_thinking คืออะไร และควรใช้เมื่อใด?โดยค่าเริ่มต้น การใช้เหตุผลจะถูกเก็บไว้เฉพาะในรอบปัจจุบันเท่านั้น เมื่อตั้งค่า preserve_thinking: true โมเดลจะคง Chain-of-Thought จากการสนทนาก่อนหน้าทั้งหมดไว้ ใช้สำหรับ Agent Loops แบบหลายขั้นตอนที่การใช้เหตุผลในอดีตของโมเดลควรมีผลต่อการกระทำถัดไป

Qwen3.6-Plus เปรียบเทียบกับ Claude Opus 4.5 อย่างไร?Claude Opus 4.5 นำใน SWE-bench Verified (80.9% เทียบกับ 78.8%) และ OSWorld-Verified (66.3% เทียบกับ 62.5%) ส่วน Qwen3.6-Plus นำใน Terminal-Bench 2.0 (61.6% เทียบกับ 59.3%), MCPMark (48.2% เทียบกับ 42.3%), DeepPlanning (41.5% เทียบกับ 33.9%) และ GPQA (90.4% เทียบกับ 87.0%)

ฉันสามารถใช้ Qwen3.6-Plus กับ Claude Code ได้หรือไม่?ได้ ตั้งค่า ANTHROPIC_BASE_URL ไปยัง Endpoint ที่เข้ากันได้กับ Dashscope Anthropic, ANTHROPIC_MODEL เป็น qwen3.6-plus และ ANTHROPIC_AUTH_TOKEN เป็น API key ของ Dashscope ของคุณ

Qwen3.6-Plus เป็น Open Source หรือไม่?โมเดล API ที่โฮสต์อยู่ไม่ใช่ Open-weight แต่เวอร์ชันขนาดเล็กกว่าที่มี Weights สาธารณะได้รับการยืนยันว่าจะเปิดตัวภายในไม่กี่วัน

ฉันจะเข้าถึงได้ฟรีได้อย่างไร?ติดตั้ง Qwen Code (npm install -g @qwen-code/qwen-code@latest), รัน qwen จากนั้น /auth ลงชื่อเข้าใช้ด้วย Qwen Code OAuth เพื่อรับการเรียกใช้ API ฟรี 1,000 ครั้งต่อวันสำหรับ Qwen3.6-Plus

รองรับ Context Window ขนาดเท่าใด?1 ล้านโทเค็นโดยค่าเริ่มต้น Benchmark บางรายการในรายงานอย่างเป็นทางการใช้ 256K สำหรับการเปรียบเทียบมาตรฐาน แต่ค่าเริ่มต้นของ API คือ 1M

ฉันจะทดสอบการผสานรวม API ก่อนการปรับใช้ได้อย่างไร?นำเข้า Endpoint ไปยัง Apidog, เพิ่ม API key ของคุณเป็นตัวแปรสภาพแวดล้อม, เขียน Assertion การตอบกลับ และใช้ Smart Mock สำหรับการพัฒนาแบบออฟไลน์ เชื่อมโยงคำขอเข้ากับ Test Scenario เพื่อตรวจสอบพฤติกรรม Agent แบบหลายรอบตั้งแต่ต้นจนจบ

ฝึกการออกแบบ API แบบ Design-first ใน Apidog

ค้นพบวิธีที่ง่ายขึ้นในการสร้างและใช้ API