คุณต้องเผชิญกับค่าใช้จ่ายคลาวด์ที่สูงเมื่อคุณใช้งาน AI agent ที่ทรงพลังทุกวัน Qwen3.5 มอบความสามารถในการให้เหตุผลแบบหลายโมดอลระดับแนวหน้าให้คุณใช้งานได้ในเครื่อง คุณนำมันมารวมกับ OpenClaw สำหรับเวิร์กโฟลว์ของ agent ที่ทำงานต่อเนื่อง และ Ollama สำหรับการให้บริการในเครื่องอย่างง่ายดาย ผลลัพธ์ที่ได้คือ AI agent ที่สมบูรณ์แบบซึ่งทำงานตลอด 24 ชั่วโมงทุกวันบนเครื่องของคุณโดยไม่ต้องเสียค่าสมัครสมาชิก
การตัดสินใจเล็กๆ น้อยๆ มีความสำคัญ คุณเลือกรุ่นที่ถูกต้อง คุณตั้งค่า URL พื้นฐานที่ถูกต้อง การตัดสินใจเหล่านี้สร้างความแตกต่างอย่างมากในด้านความเร็วและความน่าเชื่อถือ คู่มือนี้จะแสดงขั้นตอนที่ชัดเจนเพื่อให้คุณได้สแต็คที่พร้อมใช้งานจริงที่คุณควบคุมได้อย่างสมบูรณ์
อะไรที่ทำให้ Qwen3.5 เหมาะสมอย่างยิ่งสำหรับงาน Agent ในเครื่อง
Alibaba ได้เปิดตัว Qwen3.5 ในช่วงต้นปี 2026 ในฐานะกลุ่มโมเดลวิสัยทัศน์-ภาษา (vision-language) ดั้งเดิมรุ่นแรกของบริษัท เรือธงรุ่น 397B-A17B ใช้สถาปัตยกรรมไฮบริด โดยผสมผสาน Gated Delta Networks เข้ากับ Mixture-of-Experts แบบกระจัดกระจาย มีเพียง 1.7 หมื่นล้านพารามิเตอร์เท่านั้นที่ทำงานต่อโทเค็น คุณจึงได้รับประสิทธิภาพที่แข็งแกร่งโดยใช้หน่วยความจำน้อยลงมาก

Ollama ให้บริการแท็กที่เป็นประโยชน์เหล่านี้ที่คุณสามารถดึงมาใช้งานได้วันนี้:
- qwen3.5:35b — ใช้ VRAM 24 GB, บริบท 256K, รองรับข้อความและรูปภาพเต็มรูปแบบ
- qwen3.5:122b — ต้องการ 81 GB สำหรับการให้เหตุผลที่ลึกซึ้งยิ่งขึ้น
คุณสามารถรัน qwen3.5 ในเครื่องของคุณและเก็บข้อมูลของคุณให้เป็นส่วนตัว โมเดลนี้ได้คะแนน 86.7 บน TAU2-Bench และ 85.0 บน MMMU คุณจึงเชื่อถือได้สำหรับงาน agent ที่ผสมผสานข้อความ ภาพหน้าจอ และการเรียกใช้เครื่องมือ
OpenClaw เปลี่ยน Qwen3.5 ให้เป็น Agent จริงได้อย่างไร
OpenClaw ทำงานเป็นรันไทม์ของ agent ที่เปิดใช้งานตลอดเวลา คุณเชื่อมต่อมันเข้ากับ WhatsApp, Telegram, Slack, Discord หรือ Signal เพียงครั้งเดียว agent จะคอยฟังอย่างต่อเนื่อง เมื่อคุณส่งข้อความ OpenClaw จะส่งต่อไปยัง qwen3.5, เรียกใช้เครื่องมือ, ควบคุมเบราว์เซอร์ของคุณด้วย Playwright, แก้ไขไฟล์, อัปเดตปฏิทิน และตอบกลับอย่างเชิงรุก

คุณจัดเก็บหน่วยความจำข้ามเซสชัน agent จะจดจำโปรเจกต์และความชอบของคุณได้ตลอดไป คุณสามารถติดตั้งทักษะ (skills) ของชุมชน หรือให้ qwen3.5 เขียนทักษะใหม่ตามต้องการ ดังนั้น OpenClaw จึงกลายเป็นผู้ช่วยดิจิทัลส่วนตัวของคุณที่ไม่เคยหลับใหล
ทำไม Ollama จึงทำให้การรวมระบบเป็นเรื่องง่าย
Ollama ให้บริการโมเดลในเครื่องและเปิดเผยปลายทางที่เข้ากันได้กับ OpenAI ที่พอร์ต 11434 คุณชี้ OpenClaw ไปที่ http://localhost:11434/v1 และตั้งค่าโมเดลเป็น qwen3.5:35b Ollama จัดการการควอนไทซ์ (quantization), การถ่ายโอนงานไปยัง GPU (GPU offload) และการจัดการบริบทโดยอัตโนมัติ
คุณสามารถสร้างโทเค็นได้อย่างรวดเร็วบนฮาร์ดแวร์ของผู้บริโภค คุณยังคงหน้าต่างบริบท 256K เต็มรูปแบบที่ qwen3.5 ต้องการสำหรับการสนทนาของ agent ที่ยาวนาน คุณหลีกเลี่ยงค่าใช้จ่ายคลาวด์และการรั่วไหลของข้อมูลได้ในเวลาเดียวกัน
ข้อกำหนดเบื้องต้นที่คุณต้องปฏิบัติตาม
คุณเตรียมเครื่องของคุณก่อนที่จะเริ่ม ใช้งาน macOS 14 หรือใหม่กว่า, Ubuntu 22.04/24.04, หรือ Windows 11 ที่มี WSL2 คุณต้องมี VRAM อย่างน้อย 24 GB สำหรับโมเดล 35B หรือหน่วยความจำรวม 32 GB บน Apple Silicon คงพื้นที่ว่างในดิสก์ 30 GB ติดตั้ง Node.js 22 หรือสูงกว่า และ Ollama 0.17 หรือใหม่กว่า
คุณตรวจสอบ GPU ของคุณในภายหลังด้วยคำสั่งเดียว ฮาร์ดแวร์ที่ตรงตามข้อกำหนดเหล่านี้จะให้ประสิทธิภาพที่ตอบสนองได้ดี คุณสามารถกลับไปใช้โมเดลที่ถูกควอนไทซ์ขนาดเล็กกว่าได้หากคุณมีหน่วยความจำน้อยลง
ติดตั้ง Ollama และดึง Qwen3.5
คุณเริ่มด้วยการติดตั้ง Ollama บน macOS คุณรัน:
brew install ollama
brew services start ollama
บน Linux คุณรัน:
curl -fsSL https://ollama.com/install.sh | sh
systemctl enable --now ollama
คุณยืนยันว่าบริการทำงานด้วย ollama list ถัดไปคุณดึงโมเดล:
ollama pull qwen3.5:35b
การดาวน์โหลดจะเสร็จสิ้นภายใน 10 ถึง 30 นาที คุณทดสอบการอนุมานพื้นฐาน:
ollama run qwen3.5:35b
คุณพิมพ์พรอมต์ภายใน REPL Qwen3.5 จะตอบกลับได้อย่างแม่นยำ คุณออกจากระบบด้วย /bye
คุณตรวจสอบปลายทางที่เข้ากันได้กับ OpenAI ทันที เนื่องจาก OpenClaw ต้องการมัน:
curl http://localhost:11434/v1/models
การตอบกลับจะแสดง qwen3.5:35b คุณทราบว่าการเชื่อมต่อใช้งานได้
เปิดใช้งาน OpenClaw ด้วย Qwen3.5
คุณใช้คำสั่ง Ollama คำสั่งเดียวเพื่อติดตั้งและเริ่มต้นทุกอย่าง:
ollama launch openclaw --model qwen3.5:35b
Ollama จะติดตั้งส่วนประกอบที่ขาดหายไป, เริ่มต้นเกตเวย์, และเปิดวิซาร์ด TUI คุณเชื่อมต่อช่องทางการส่งข้อความของคุณ, ยืนยันผู้ให้บริการโมเดล, และบันทึกการตั้งค่า เกตเวย์ทำงานที่พอร์ต 8080
คุณทดสอบโดยการส่งข้อความถึงบอทของคุณบน Telegram: “แสดงรายการไฟล์ในโฟลเดอร์ดาวน์โหลดของฉัน” OpenClaw ใช้ qwen3.5 และส่งคืนผลลัพธ์
คุณยังสามารถกำหนดค่าด้วยตนเองได้ คุณแก้ไข ~/.openclaw/openclaw.json และตั้งค่า URL พื้นฐานของผู้ให้บริการ Ollama คุณรีสตาร์ทด้วย openclaw start ทั้งสองวิธีให้ผลลัพธ์ที่เหมือนกัน
ทดสอบ Full Stack ด้วย Apidog
คุณเปิด Apidog และสร้างโปรเจกต์ใหม่ชื่อ “Qwen3.5 OpenClaw Local Stack” คุณตั้งค่า URL พื้นฐานเป็น http://localhost:11434/v1

คุณเพิ่มคำขอ POST ไปยัง /chat/completions คุณรวมส่วนหัวเหล่านี้:
- Content-Type: application/json
- Authorization: Bearer ollama
คุณใช้เนื้อหา (body) นี้:
{
"model": "qwen3.5:35b",
"messages": [
{"role": "system", "content": "You are a helpful agent."},
{"role": "user", "content": "Plan steps to organize my Downloads folder by file type."}
],
"temperature": 0.7,
"max_tokens": 2048
}
คุณส่งคำขอ Apidog จะแสดงโทเค็นที่กำลังสตรีมแบบเรียลไทม์ คุณเพิ่มการยืนยันผลลัพธ์แบบเห็นภาพสำหรับรหัสสถานะ 200 คุณบันทึกคำขอเป็นสถานการณ์ทดสอบ คุณรันสถานการณ์นั้นอีกครั้งหลังจากที่คุณเปลี่ยนการตั้งค่า ดังนั้นคุณจึงสามารถตรวจจับปัญหาได้ทันที
คุณสร้างคอลเลกชันที่สองสำหรับเกตเวย์ของ OpenClaw ที่ http://localhost:8080/v1 คุณทดสอบการส่งข้อความแบบ end-to-end การตรวจสอบ schema ของ Apidog ยืนยันว่ารูปแบบการเรียกใช้เครื่องมือตรงกับที่ OpenClaw คาดหวัง
ออกแบบและจัดทำเอกสารปลายทางของคุณใน Apidog
คุณใช้ดีไซเนอร์แบบเห็นภาพของ Apidog เพื่อสร้างแบบจำลอง schema สำหรับการตอบกลับการแชท คุณนำเข้าสเปก OpenAI อย่างเป็นทางการ คุณปรับแต่งให้เข้ากับพารามิเตอร์ของ qwen3.5 คุณสร้าง เอกสารประกอบแบบโต้ตอบได้โดยอัตโนมัติ คุณแชร์เอกสารกับเพื่อนร่วมทีมผ่าน Apidog workspaces หากคุณทำงานร่วมกัน

คุณยังสร้างการตอบกลับจำลองภายใน Apidog คุณจำลองการเรียกใช้เครื่องมือก่อนที่คุณจะตั้งค่า OpenClaw เสร็จสมบูรณ์ ดังนั้นคุณจึงพัฒนาได้เร็วขึ้นและทดสอบกรณีพิเศษได้อย่างปลอดภัย
การกำหนดค่าขั้นสูงเพื่อประสิทธิภาพที่ดีขึ้น
คุณสร้าง Modelfile แบบกำหนดเองเมื่อคุณต้องการการควอนไทซ์ที่เบาลง:
FROM qwen3.5:35b
PARAMETER num_gpu 999
PARAMETER num_ctx 131072
คุณสร้างมันด้วย ollama create qwen3.5:35b-q4 -f Modelfile คุณอัปเดตการกำหนดค่า OpenClaw ของคุณเพื่อใช้แท็กใหม่
คุณเปิดใช้งานวิสัยทัศน์โดยการส่งรูปภาพ base64 ในข้อความแชท Qwen3.5 ประมวลผลภาพหน้าจอที่ OpenClaw จับภาพได้ระหว่างงานเบราว์เซอร์ ดังนั้นคุณจึงทำให้แบบฟอร์มที่ต้องใช้ความเข้าใจทางภาพเป็นไปโดยอัตโนมัติ
คุณติดตั้งทักษะเพิ่มเติม:
openclaw skill install @community/calendar
openclaw skill install @community/github
ทักษะแต่ละอย่างจะลงทะเบียน JSON schemas Qwen3.5 เรียนรู้ที่จะเรียกใช้สิ่งเหล่านี้โดยอัตโนมัติ คุณตรวจสอบการใช้งานภายในแดชบอร์ด OpenClaw
เวิร์กโฟลว์ในโลกจริงที่คุณสามารถใช้งานได้วันนี้
คุณใช้สแต็คนี้สำหรับการรีวิวโค้ด คุณส่งข้อความถึง OpenClaw: “รีวิว PR ใน repo ของฉันและแนะนำการปรับโครงสร้าง” agent จะโคลนรีโพซิโทรี, วิเคราะห์โค้ด, และสร้างแพตช์
คุณทำให้งานส่วนตัวเป็นไปโดยอัตโนมัติ คุณเขียน: “ตรวจสอบกล่องจดหมายของฉันเพื่อหาการยืนยันเที่ยวบินและเพิ่มลงในปฏิทิน” OpenClaw จะวิเคราะห์อีเมลและอัปเดตปฏิทินของคุณ
คุณสร้างผู้ช่วยวิจัย คุณส่งภาพหน้าจอ PDF และขอสรุปพร้อมคำถามติดตามผล Qwen3.5 สกัดข้อความได้อย่างแม่นยำ OpenClaw รักษาบริบทไว้ได้ข้ามวัน
คุณใช้งาน agent หลายตัว คุณเปิดพื้นที่ทำงาน OpenClaw แยกกัน ตัวหนึ่งใช้ qwen3.5:35b สำหรับงานทั่วไป อีกตัวใช้โมเดลโค้ดเดอร์เฉพาะทาง เกตเวย์จะส่งข้อความไปยังที่ที่ถูกต้อง
เพิ่มประสิทธิภาพความเร็วและการใช้หน่วยความจำ
คุณตั้งค่า OLLAMA_NUM_GPU=999 เพื่อใช้เลเยอร์ GPU ทั้งหมด คุณตรวจสอบด้วย nvidia-smi บน Apple Silicon คุณเปิดใช้งาน flash attention
คุณลดการบวมของบริบทด้วยพรอมต์สรุปเป็นระยะที่ qwen3.5 รันโดยอัตโนมัติ คุณเปรียบเทียบอัตราโทเค็นต่อวินาที โมเดล 35B สามารถทำได้ 45–60 โทเค็นต่อวินาทีบน GPU ระดับ 4090 คุณเลือกเวอร์ชันที่เหมาะสมกับฮาร์ดแวร์ของคุณ
คุณใช้การทดสอบประสิทธิภาพของ Apidog เพื่อวัดความหน่วง (latency) ในการส่งคำขอ 100 ครั้ง คุณปรับอุณหภูมิ (temperature) และ max_tokens จนกว่าจะถึงเวลาตอบสนองที่คุณต้องการ
แก้ไขปัญหาทั่วไปได้อย่างรวดเร็ว
คุณเห็น “model not found” คุณรัน ollama list และแก้ไขแท็กในการกำหนดค่าของคุณ
คุณประสบปัญหาความหน่วงสูง คุณตรวจสอบบันทึกด้วย journalctl -u ollama และเพิ่มเลเยอร์ GPU คุณใช้ Apidog เพื่อทดสอบคำขอเดิมอีกครั้งและยืนยันการปรับปรุง
การแยกวิเคราะห์การเรียกใช้เครื่องมือล้มเหลว คุณล็อกอุณหภูมิ (temperature) ที่ 0.7 ภายในสถานการณ์ทดสอบ Apidog แล้วรันซ้ำ
OpenClaw สูญเสียการเชื่อมต่อกับแอปส่งข้อความ คุณรัน openclaw configure --section channels เพื่อรีเฟรชโทเค็น
คุณชนขีดจำกัดอัตรา (rate limits) ใน Ollama คุณเพิ่มการตั้งค่าการทำงานพร้อมกัน (concurrency) และทดสอบอีกครั้งใน Apidog
คุณใช้บานหน้าต่างตรวจสอบข้อผิดพลาดของ Apidog สำหรับทุกปัญหา การติดตามสแต็กแบบเห็นภาพและการเปรียบเทียบการตอบกลับช่วยเร่งการแก้ไขปัญหาได้อย่างมาก
รักษาความปลอดภัยการตั้งค่าของคุณ
คุณรัน OpenClaw ภายใต้บัญชีผู้ใช้เฉพาะ คุณเปิดใช้งาน sandboxing สำหรับการดำเนินการเครื่องมือ คุณไม่เคยเปิดเผยพอร์ต 11434 หรือ 8080 สู่สาธารณะ คุณเข้าถึงพอร์ตเหล่านี้ผ่าน SSH tunnels หรือ Tailscale เมื่อคุณเดินทาง
คุณตรวจสอบซอร์สโค้ดของทักษะทุกอย่างก่อนที่คุณจะติดตั้ง คุณเปิดใช้งานการเข้ารหัสหน่วยความจำในการตั้งค่า OpenClaw คุณสำรองข้อมูลโฟลเดอร์ ~/.openclaw เป็นประจำ
ดังนั้น คุณจึงใช้งานระบบที่ปลอดภัยกว่าบริการคลาวด์ส่วนใหญ่ เพราะข้อมูลของคุณไม่เคยออกจากเครือข่ายของคุณ
วางแผนสำหรับการอัปเดตในอนาคต
Alibaba ปล่อย Qwen3.5 เวอร์ชันที่เล็กลงมาเป็นประจำ Ollama จะเพิ่มเวอร์ชันเหล่านั้นอย่างรวดเร็ว คุณดึงการอัปเดตด้วย ollama pull qwen3.5:35b --force
ไลบรารีทักษะของ OpenClaw เติบโตขึ้นทุกสัปดาห์ คุณตรวจสอบการแจ้งเตือน GitHub เพื่อติดตามความเคลื่อนไหว
คุณทำซ้ำกระบวนการทดสอบ Apidog หลังจากการอัปเดตแต่ละครั้ง คุณเก็บชุดทดสอบของคุณไว้และเพียงแค่เปลี่ยนแท็กโมเดล ดังนั้นคุณจึงรักษาระดับความน่าเชื่อถือไว้ได้โดยไม่ต้องทำงานเพิ่ม
สรุป
ตอนนี้คุณสามารถรัน qwen3.5 ด้วย OpenClaw ได้ฟรีโดยใช้ Ollama คุณควบคุมสแต็คทั้งหมดบนฮาร์ดแวร์ของคุณ คุณจะได้รับความสามารถในการให้เหตุผลที่แข็งแกร่ง, การรองรับวิสัยทัศน์, หน่วยความจำแบบถาวร, และระบบอัตโนมัติเชิงรุก
คุณได้ปฏิบัติตามขั้นตอนที่ชัดเจน คุณได้ทดสอบทุกเลเยอร์ด้วย Apidog คุณได้เพิ่มประสิทธิภาพและรักษาความปลอดภัยของสภาพแวดล้อม การเลือกการกำหนดค่าเล็กน้อยทำให้เกิด AI agent ส่วนตัวที่มีความสามารถ
เปิดเทอร์มินัลของคุณตอนนี้ รันคำสั่งเปิดใช้งาน เชื่อมต่อแอปส่งข้อความของคุณ ส่งงานแรกของคุณ แล้วคุณจะเห็นว่า agent ที่ทำงานในเครื่องอย่างสมบูรณ์นั้นทรงพลังเพียงใด
ดาวน์โหลด Apidog เพื่อติดตามการอัปเดตในอนาคตและทดสอบปลายทางของคุณอย่างมีประสิทธิภาพ คุณมีทุกสิ่งที่คุณต้องการเพื่อสร้างเวิร์กโฟลว์ที่ชาญฉลาดขึ้นแล้ววันนี้

