วิธีใช้ OpenClaw กับ Ollama

Ashley Innocent

Ashley Innocent

26 February 2026

วิธีใช้ OpenClaw กับ Ollama

Apidog สำหรับองค์กร

ติดตั้งภายในองค์กร

SSO & RBAC

รองรับ SOC 2

สำรวจ Apidog Enterprise

TL;DR

Ollama เป็นวิธีที่ง่ายที่สุดในการรันโมเดล AI ที่ทรงพลังบนเครื่องของคุณเอง (locally) เมื่อใช้ร่วมกับ OpenClaw จะสร้างผู้ช่วย AI ที่ฟรีและเน้นความเป็นส่วนตัว ซึ่งเทียบเท่ากับทางเลือกที่ต้องเสียค่าใช้จ่าย คู่มือนี้จะแนะนำคุณเกี่ยวกับการตั้งค่า Ollama, การเลือกโมเดลที่เหมาะสม, และการผสานรวมกับ OpenClaw เพื่อสร้างผู้ช่วย AI ส่วนตัวของคุณ

บทนำ

การรัน AI บนเครื่องของคุณเอง (locally) ครั้งหนึ่งเคยเป็นงานอดิเรกที่ต้องใช้การตั้งค่าที่ซับซ้อนและฮาร์ดแวร์ราคาแพง Ollama ได้เปลี่ยนสิ่งนั้นไป ด้วยคำสั่งติดตั้งที่ง่ายดายและ API ที่ใช้งานง่าย Ollama ทำให้การรันโมเดล AI บนเครื่องของคุณเองสามารถเข้าถึงได้สำหรับทุกคน

ollama launch openclaw --model qwen3.5:35b

เมื่อจับคู่กับ OpenClaw คุณจะได้รับผู้ช่วย AI ที่ทรงพลังซึ่ง:

คู่มือนี้ครอบคลุมทุกสิ่งที่คุณจำเป็นต้องรู้เพื่อเริ่มต้น

ทำไมต้องใช้ Ollama กับ OpenClaw

ประโยชน์ของ AI บนเครื่องของคุณเอง (Local AI)

ทำไมต้อง Ollama

Ollama โดดเด่นด้วยเหตุผลหลายประการ:

ข้อกำหนดเบื้องต้น

ก่อนเริ่มต้น โปรดตรวจสอบให้แน่ใจว่าคุณมี:

ข้อกำหนดด้านฮาร์ดแวร์

ขนาดโมเดลRAM ขั้นต่ำRAM ที่แนะนำ
7B พารามิเตอร์8GB16GB
14B พารามิเตอร์16GB32GB
32B พารามิเตอร์32GB64GB
70B พารามิเตอร์64GB128GB

ข้อกำหนดด้านซอฟต์แวร์

สิ่งที่คุณต้องมี

  1. คอมพิวเตอร์ที่ตรงตามข้อกำหนด RAM
  2. อินเทอร์เน็ตสำหรับดาวน์โหลดโมเดล
  3. เวลาสำหรับการดาวน์โหลดโมเดลครั้งแรก (ขึ้นอยู่กับขนาดและการเชื่อมต่อ)

การติดตั้ง Ollama

การติดตั้งบน macOS

วิธีที่ง่ายที่สุดคือการใช้ Homebrew:

brew install ollama

หรือใช้สคริปต์ติดตั้งอย่างเป็นทางการ:

curl -fsSL https://ollama.ai/install.sh | sh

การติดตั้งบน Linux

# ใช้สคริปต์ติดตั้ง (แนะนำ)
curl -fsSL https://ollama.ai/install.sh | sh

# หรือดาวน์โหลดไฟล์ไบนารีโดยตรง
sudo curl -L https://ollama.ai/download/ollama-linux-amd64 -o /usr/bin/ollama
sudo chmod +x /usr/bin/ollama

การติดตั้งบน Windows

  1. ดาวน์โหลด ตัวติดตั้ง
  2. รันตัวติดตั้ง
  3. ทำตามคำแนะนำบนหน้าจอ
ดาวน์โหลด Ollama

การยืนยันการติดตั้ง

ollama --version

คุณควรเห็นผลลัพธ์เช่น ollama version 0.15.0 หรือใหม่กว่า

เวอร์ชัน Ollama บนเทอร์มินัล

การเริ่มบริการ Ollama

Ollama ทำงานเป็นบริการพื้นหลัง:

# ตรวจสอบว่า Ollama กำลังทำงานอยู่หรือไม่
ollama list

# เริ่ม Ollama หากยังไม่ได้ทำงาน
ollama serve
ตรวจสอบว่า ollama กำลังทำงานอยู่หรือไม่ด้วยคำสั่ง Ollama list

การเลือกโมเดลที่เหมาะสม

Ollama รองรับโมเดลกว่า 100+ รายการ นี่คือวิธีการเลือก:

ตามกรณีการใช้งาน

กรณีการใช้งานโมเดลที่แนะนำ
การสนทนาทั่วไปQwen3.5, Llama 3.2, Mistral
ตัวช่วยเขียนโค้ดQwen3.5-Coder, DeepSeek-Coder
การให้เหตุผล/คณิตศาสตร์DeepSeek-R1, Qwen3.5
ฮาร์ดแวร์ขนาดเล็กPhi3.5, Gemma2.2B

ตามฮาร์ดแวร์

RAM ที่มีอยู่แนะนำ
8GBโมเดล 7B (Qwen3.5, Llama3.2, Mistral)
16GBโมเดล 8-14B
32GBโมเดล 14-32B
64GB+โมเดล 70B+

โมเดลยอดนิยมในปี 2026

Qwen3.5 — ประสิทธิภาพรอบด้านยอดเยี่ยม, การให้เหตุผลที่แข็งแกร่ง, เหมาะสำหรับการเขียนโค้ด. เป็นตัวเลือกที่ได้รับความนิยมมากที่สุดสำหรับ OpenClaw ในปี 2026

DeepSeek-R1 — โมเดลให้เหตุผลแบบโอเพนซอร์สที่เทียบเท่า GPT-4 ในงานคณิตศาสตร์และตรรกะ. ยอดเยี่ยมสำหรับการแก้ปัญหาที่ซับซ้อน

Mistral — มีน้ำหนักเบาแต่มีความสามารถ. ยอดเยี่ยมสำหรับระบบที่มี RAM จำกัด

การติดตั้งโมเดล

การดึงโมเดล

# ติดตั้ง Qwen3.5 (แนะนำสำหรับผู้ใช้ส่วนใหญ่)
ollama pull qwen2.5:7b

# หรือ Qwen3 เวอร์ชันล่าสุด
ollama pull qwen3:7b

# DeepSeek-R1 สำหรับงานที่ต้องใช้เหตุผล
ollama pull deepseek-r1:7b

# Llama 3.2
ollama pull llama3.2:7b

# Mistral
ollama pull mistral:7b

แท็กโมเดล

โมเดลมีขนาดที่แตกต่างกัน:

# ขนาดพารามิเตอร์ที่แตกต่างกัน
ollama pull qwen2.5:3b    # เล็กกว่า, เร็วกว่า
ollama pull qwen2.5:7b    # สมดุล
ollama pull qwen2.5:14b   # มีความสามารถมากขึ้น

การดูโมเดลที่ติดตั้งแล้ว

ollama list

สิ่งนี้จะแสดงโมเดลที่ดาวน์โหลดทั้งหมดและขนาดของมัน

การรันและทดสอบโมเดล

โหมดโต้ตอบ

# สนทนากับโมเดล
ollama run qwen2.5:7b

พิมพ์ข้อความของคุณแล้วกด Enter. พิมพ์ /bye เพื่อออก

โหมด API

โดยค่าเริ่มต้น Ollama จะรันเซิร์ฟเวอร์ API บนพอร์ต 11434:

# Endpoint สำหรับการสร้างข้อความ
curl http://localhost:11434/api/generate -d {
  "model": "qwen2.5:7b",
  "prompt": "Hello, how are you?",
  "stream": false
}

การใช้ไลบรารี Python

from ollama import Client

client = Client()
response = client.chat(
    model='qwen2.5:7b',
    messages=[
        {'role': 'user', 'content': 'Hello!'}
    ]
)
print(response['message']['content'])

การทดสอบด้วย Apidog

ก่อนเชื่อมต่อกับ OpenClaw ให้ทดสอบการตั้งค่า Ollama ของคุณโดยใช้ Apidog:

  1. สร้างคำขอใหม่ใน Apidog
  2. ตั้งค่า method เป็น POST
  3. ป้อน URL: http://localhost:11434/api/generate
  4. เพิ่มส่วนหัว: Content-Type: application/json
สร้างคำขอใน Apidog

5. เพิ่มเนื้อหา:

{
  "model": "qwen3-coder",
  "prompt": "What is 2 + 2?",
  "stream": false
}

เพิ่มเนื้อหา (Body) ให้กับคำขอใน Apidog

สิ่งนี้จะยืนยันว่าการตั้งค่า Ollama ของคุณทำงานได้ก่อนที่จะผสานรวมกับ OpenClaw

การผสานรวม Ollama กับ OpenClaw

ตอนนี้เรามาเชื่อมต่อ Ollama กับ OpenClaw กัน

วิธีที่ 1: การตั้งค่าแบบรวดเร็ว

# ตั้งค่า OpenClaw ให้ใช้ Ollama กับโมเดลของคุณ
openclaw models set ollama/qwen2.5:7b

วิธีที่ 2: ตัวแปรสภาพแวดล้อม (Environment Variables)

# กำหนดค่า endpoint ของ Ollama
export OLLAMA_HOST=http://localhost:11434

# ตั้งค่าโมเดลเริ่มต้น
export OLLAMA_MODEL=qwen2.5:7b

วิธีที่ 3: ไฟล์คอนฟิกูเรชัน

สร้างหรือแก้ไข ~/.openclaw/config.yaml:

models:
  default: ollama/qwen2.5:7b

ollama:
  host: http://localhost:11434
  model: qwen2.5:7b
  temperature: 0.7
  top_p: 0.9

การยืนยันการผสานรวม

# ตรวจสอบสถานะโมเดล OpenClaw
openclaw models status

# ทดสอบด้วยข้อความ
openclaw chat "Hello!"

คุณควรได้รับการตอบกลับจากโมเดลบนเครื่องของคุณ

ตัวเลือกการตั้งค่า

ปรับแต่งการตั้งค่า Ollama + OpenClaw ของคุณ:

Temperature (อุณหภูมิ)

ควบคุมความคิดสร้างสรรค์เทียบกับความแม่นยำ:

ollama:
  temperature: 0.7    # 0.0 = แม่นยำ, 1.0 = สร้างสรรค์

Top-P และ Top-K

ควบคุมความหลากหลายของการตอบกลับ:

ollama:
  top_p: 0.9         # การสุ่มแบบ Nucleus
  top_k: 40          # การเลือกโทเค็น

ความยาวบริบท

สำหรับการสนทนาที่ยาวขึ้น:

ollama:
  context_size: 4096  # ค่าเริ่มต้นมักจะเป็น 2048 หรือ 4096

System Prompt (พรอมต์ระบบ)

ปรับแต่งพฤติกรรมของโมเดล:

ollama:
  system_prompt: |
    คุณเป็นผู้ช่วยเขียนโค้ดที่เป็นประโยชน์.
    จัดเตรียมตัวอย่างโค้ดที่ชัดเจนและรัดกุม.
    อธิบายแนวคิดง่ายๆ.

การสลับระหว่างโมเดล

ข้อดีอย่างหนึ่งของ Ollama คือการสลับโมเดลได้ง่าย:

# สลับไปใช้ DeepSeek-R1 สำหรับการให้เหตุผล
openclaw models set ollama/deepseek-r1:7b

# สลับไปใช้ Qwen-Coder สำหรับงานเขียนโค้ด
openclaw models set ollama/qwen2.5-coder:7b

# สลับกลับไปใช้โมเดลทั่วไป
openclaw models set ollama/qwen2.5:7b

การตั้งค่าหลายโมเดล

กำหนดค่าโมเดลหลายตัวใน config.yaml:

models:
  default: ollama/qwen2.5:7b
  coding: ollama/qwen2.5-coder:7b
  reasoning: ollama/deepseek-r1:7b

จากนั้นสลับระหว่างกัน:

openclaw models set coding
openclaw models set reasoning

การแก้ไขปัญหา

โมเดลโหลดไม่ได้

ปัญหา: ข้อผิดพลาดหน่วยความจำไม่เพียงพอ

วิธีแก้ไข:

การตอบสนองช้า

ปัญหา: การตอบสนองใช้เวลานานเกินไป

วิธีแก้ไข:

การเชื่อมต่อถูกปฏิเสธ

ปัญหา: OpenClaw ไม่สามารถเชื่อมต่อกับ Ollama ได้

วิธีแก้ไข:

# ตรวจสอบว่า Ollama กำลังทำงานอยู่
ollama serve

# ตรวจสอบพอร์ต
curl http://localhost:11434

ไม่พบโมเดล

ปัญหา: ไม่มีโมเดลนี้อยู่ใน Ollama

วิธีแก้ไข:

# ดึงโมเดล
ollama pull qwen2.5:7b

# ตรวจสอบโมเดลที่มีอยู่
ollama list

บทสรุป

ตอนนี้คุณมีผู้ช่วย AI ที่ทรงพลังและเป็นส่วนตัวซึ่งทำงานบนเครื่องของคุณเองแล้ว Ollama + OpenClaw มอบความสามารถที่จะต้องเสียค่าใช้จ่ายกว่า $20+/เดือน หากใช้บริการคลาวด์ ซึ่งทั้งหมดนี้ทำงานบนฮาร์ดแวร์ที่คุณควบคุมเอง

สิ่งที่คุณสามารถทำได้ตอนนี้:

ข้อจำกัดเพียงอย่างเดียวคือฮาร์ดแวร์ของคุณ

ขั้นตอนต่อไป:

  1. ทดลองใช้โมเดลที่แตกต่างกัน
  2. ลองใช้ Qwen3.5, DeepSeek-R1, และอื่นๆ
  3. ปรับแต่งพรอมต์ระบบของคุณ
  4. สำรวจทักษะ OpenClaw บน ClawHub

พร้อมที่จะสร้างแอปพลิเคชัน AI ระดับมืออาชีพแล้วหรือยัง? ดาวน์โหลด Apidog ฟรี และทดสอบการผสานรวม AI ของคุณด้วยอินเทอร์เฟซแบบกราฟิกที่ออกแบบมาสำหรับนักพัฒนา

button

คำถามที่พบบ่อย

โมเดล Ollama ใดดีที่สุดสำหรับ OpenClaw?

Qwen3.5 เป็นที่นิยมมากที่สุดในขณะนี้ — มีประสิทธิภาพที่สมดุล พร้อมความสามารถในการให้เหตุผลและการเขียนโค้ดที่ดีเยี่ยม DeepSeek-R1 โดดเด่นในงานที่ต้องใช้เหตุผล หากนั่นคือสิ่งที่คุณให้ความสำคัญ

ฉันสามารถรันโมเดล Ollama หลายตัวพร้อมกันได้หรือไม่?

ได้ แต่ละโมเดลต้องใช้ RAM การตั้งค่าทั่วไปจะรันทีละโมเดล โดยจะสลับไปมาตามความจำเป็น

ฉันจำเป็นต้องมี GPU หรือไม่?

ไม่จำเป็น Ollama สามารถทำงานบน CPU ได้ การเร่งความเร็วด้วย GPU ทำให้เร็วขึ้นแต่ไม่จำเป็นต้องมี โมเดลขนาดเล็ก (7B) ทำงานได้ดีพอสมควรบน CPU

ฉันจะอัปเดตโมเดลได้อย่างไร?

ollama pull model-name

Ollama จะอัปเดตโดยอัตโนมัติหากมีเวอร์ชันใหม่กว่า

ฉันสามารถใช้โมเดลที่ฉันปรับแต่งเองได้หรือไม่?

ได้ คุณสามารถนำเข้าโมเดลที่กำหนดเองโดยใช้ฟังก์ชันการนำเข้าของ Ollama ตรวจสอบเอกสารของ Ollama สำหรับรายละเอียด

ฝึกการออกแบบ API แบบ Design-first ใน Apidog

ค้นพบวิธีที่ง่ายขึ้นในการสร้างและใช้ API