วิธีใช้ MCP Server ควบคุม Chrome Browser ด้วย Browserbase MCP Server

Ashley Goolam

Ashley Goolam

24 July 2025

วิธีใช้ MCP Server ควบคุม Chrome Browser ด้วย Browserbase MCP Server

เคยคิดไหมว่า AI ของคุณจะสามารถท่องเว็บได้เหมือนคุณ? เตรียมตัวให้พร้อม เพราะวันนี้เราจะมาเจาะลึกโลกของ Browserbase MCP Server—เครื่องมือที่พลิกโฉมวงการที่ช่วยให้โมเดล AI อย่าง Claude, GPT และ Gemini ควบคุมเว็บเบราว์เซอร์ได้ ลองจินตนาการว่า AI ของคุณสามารถนำทางเว็บไซต์ คลิกปุ่ม กรอกแบบฟอร์ม และแม้กระทั่งจับภาพหน้าจอได้ด้วยตัวเอง ฟังดูเป็นเรื่องอนาคตใช่ไหม? แต่มันกำลังเกิดขึ้นจริงแล้ว และการตั้งค่าก็ง่ายกว่าที่คุณคิด โดยเฉพาะอย่างยิ่งกับ Browserbase MCP Server

ในคู่มือนี้ ผมจะพาคุณไปทำความเข้าใจว่า Browserbase MCP Server คืออะไร ทำไมมันถึงเป็นสิ่งที่จำเป็นสำหรับเวิร์กโฟลว์ที่ขับเคลื่อนด้วย AI และวิธีตั้งค่าให้พร้อมใช้งานเพื่อควบคุมเบราว์เซอร์ Chrome ไม่ว่าคุณจะเป็นนักพัฒนา นักวิทยาศาสตร์ข้อมูล หรือเพียงแค่ผู้ที่สนใจ AI บทแนะนำทีละขั้นตอนนี้จะทำให้คุณรู้สึกเหมือนเป็นมืออาชีพ มาเริ่มกันเลย!

💡
ต้องการเครื่องมือทดสอบ API ที่ยอดเยี่ยมซึ่งสร้าง เอกสาร API ที่สวยงาม ใช่ไหม?

ต้องการแพลตฟอร์มแบบ All-in-One ที่ครบวงจรสำหรับทีมพัฒนาของคุณ เพื่อทำงานร่วมกันด้วย ประสิทธิภาพสูงสุด ใช่ไหม?

Apidog ตอบสนองทุกความต้องการของคุณ และ เข้ามาแทนที่ Postman ในราคาที่ย่อมเยาลงมาก!
ปุ่ม

Browserbase MCP Server คืออะไร?

Browserbase MCP Server เป็นเครื่องมือโอเพนซอร์สที่ใช้ Model Context Protocol (MCP) เพื่อเชื่อมต่อโมเดลภาษาขนาดใหญ่ (LLMs) เข้ากับเว็บเบราว์เซอร์ ลองนึกภาพว่ามันเป็นสะพานที่ช่วยให้ AI โต้ตอบกับเว็บไซต์ได้แบบเรียลไทม์ ด้วยเซิร์ฟเวอร์นี้ AI ของคุณสามารถ:

มันเหมือนกับการให้ AI ของคุณมีมือเป็นของตัวเองเพื่อท่องเว็บ และส่วนที่ดีที่สุดคืออะไรน่ะเหรอ? มันทำงานร่วมกับโมเดล AI ยอดนิยม เช่น GPT ของ OpenAI, Claude ของ Anthropic และ Gemini ของ Google

เซิร์ฟเวอร์ Browserbase MCP

ทำไมต้องใช้ Browserbase MCP Server?

ก่อนที่เราจะไปดูวิธีการใช้งาน มาคุยกันก่อนว่าทำไม Browserbase MCP Server ถึงเป็นสิ่งที่พลิกโฉมวงการ:

ไม่ว่าคุณจะกำลังสร้างแอปที่ขับเคลื่อนด้วย AI, ทำให้เวิร์กโฟลว์เป็นอัตโนมัติ หรือเพียงแค่ทดลองใช้งาน Browserbase MCP Server ช่วยประหยัดเวลาและเปิดโอกาสใหม่ๆ

วิธีติดตั้งและตั้งค่า Browserbase MCP Server

มีสามวิธีในการเริ่มต้นใช้งาน: การใช้เซิร์ฟเวอร์ระยะไกลแบบโฮสต์, การรันด้วย npm หรือการรันในเครื่อง ผมจะกล่าวถึงทั้งสามวิธี เพื่อให้คุณสามารถเลือกวิธีที่เหมาะสมที่สุดสำหรับคุณ

ข้อกำหนดเบื้องต้น

ก่อนที่คุณจะลงมือใช้ Browserbase MCP Server เพื่อควบคุมเบราว์เซอร์ Chrome ด้วย AI ตรวจสอบให้แน่ใจว่าคุณมีสิ่งต่อไปนี้:

เว็บไซต์ทางการของ Browserbase

สำหรับ การตั้งค่าในเครื่อง (ไม่บังคับ)

หากคุณวางแผนที่จะรันเซิร์ฟเวอร์ในเครื่อง คุณจะต้องมีสิ่งเหล่านี้เพิ่มเติม:

ตัวเลือกที่ 1: การใช้เซิร์ฟเวอร์ระยะไกลแบบโฮสต์ของ BrowserBase MCP Server (ง่ายที่สุด)

หากคุณต้องการหลีกเลี่ยงความยุ่งยากในการตั้งค่า ตัวเลือกแบบโฮสต์คือเพื่อนของคุณ นี่คือวิธีการ:

เยี่ยมชม Smithery: ไปที่ smithery.ai เพื่อรับคีย์ API และ URL MCP ระยะไกลของคุณ

smithery ai

กำหนดค่าไคลเอนต์ AI ของคุณ: เพิ่ม URL ที่ได้รับลงในการตั้งค่า MCP ของไคลเอนต์ AI ของคุณ ตัวอย่างเช่น ใน Claude Desktop คุณจะเพิ่มสิ่งนี้ลงใน claude_desktop_config.json ของคุณ:

{
  "mcpServers": {
    "browserbase": {
      "url": "https://your-smithery-url.com"
    }
  }
}

หรือ หากคุณกำลังใช้ mcp-remote CLI:

{
  "mcpServers": {
    "browserbase": {
      "command": "npx",
      "args": ["mcp-remote", "https://your-smithery-url.com"]
    }
  }
}

รีสตาร์ทไคลเอนต์ของคุณ: ปิดและเปิดไคลเอนต์ AI ของคุณใหม่เพื่อใช้การเปลี่ยนแปลง

แค่นั้นเอง! ตอนนี้ AI ของคุณสามารถควบคุมเบราว์เซอร์ Chrome ผ่าน Browserbase MCP Server ได้แล้ว

ตัวเลือกที่ 2: รัน BrowserBase MCP Server บน NPM (แนะนำ)

นี่คือแนวทางที่แนะนำเนื่องจากความเข้ากันได้กับไคลเอนต์ MCP ส่วนใหญ่ ไปที่ไฟล์ MCP Config JSON ของคุณแล้ววางการกำหนดค่า Browserbase Server:

{
  "mcpServers": {
    "browserbase": {
      "command": "npx",
      "args": ["@browserbasehq/mcp"],
      "env": {
        "BROWSERBASE_API_KEY": "",
        "BROWSERBASE_PROJECT_ID": "",
        "GEMINI_API_KEY": ""
      }
    }
  }
}

ตัวเลือกที่ 3: ติดตั้งและรัน BrowserBase MCP Server ในเครื่อง (เพื่อการควบคุมเต็มรูปแบบ)

ต้องการปรับแต่งภายใต้การทำงานหรือไม่? การรันเซิร์ฟเวอร์ในเครื่องจะให้ความยืดหยุ่นมากขึ้น นี่คือวิธีการ:

โคลน Repository:

git clone https://github.com/browserbase/mcp-server-browserbase.git
cd mcp-server-browserbase

ติดตั้ง Dependencies:

pnpm install && pnpm build

เริ่มเซิร์ฟเวอร์:

{
  "mcpServers": {
    "browserbase": {
      "command": "node",
      "args": ["path/to/mcp-server-browserbase/cli.js"],
      "env": {
        "BROWSERBASE_API_KEY": "your_api_key",
        "BROWSERBASE_PROJECT_ID": "your_project_id",
        "GEMINI_API_KEY": "your_gemini_key"
      }
    }
  }
}
node cli.js --port 3000

เพิ่มคีย์ API: แทนที่ตัวยึดตำแหน่งในการกำหนดค่าด้วยคีย์ API ของ Browserbase และโมเดลของคุณ

รีสตาร์ทไคลเอนต์ของคุณ: เช่นเดียวกับที่เคยทำ ให้รีสตาร์ทไคลเอนต์ AI ของคุณเพื่อเปิดใช้งานเซิร์ฟเวอร์

การปรับแต่งเซิร์ฟเวอร์

Browserbase MCP Server มีแฟล็กให้ปรับแต่งพฤติกรรมของมัน นี่คือบางส่วนที่ใช้งานได้สะดวก:

คุณสามารถเพิ่มแฟล็กเหล่านี้ลงในอาร์เรย์ args ในการกำหนดค่า MCP ของคุณได้ ตัวอย่างเช่น:

"args": ["path/to/cli.js", "--proxies", "--browserWidth=1920"]

วิธีใช้ Browserbase MCP Server เพื่อควบคุม Chrome

เมื่อเซิร์ฟเวอร์ของคุณตั้งค่าเสร็จแล้ว มาเริ่มใช้งานกันเลย! นี่คือวิธีใช้ Browserbase MCP Server เพื่อควบคุมเบราว์เซอร์ Chrome

ขั้นตอนที่ 1: เชื่อมต่อไคลเอนต์ AI ของคุณ

ตรวจสอบให้แน่ใจว่าไคลเอนต์ AI ของคุณ (เช่น Claude Desktop หรือ Cursor) เชื่อมต่อกับ Browserbase MCP Server โดยใช้วิธีใดวิธีหนึ่งในสามวิธีข้างต้น

ขั้นตอนที่ 2: ออกคำสั่ง

ในไคลเอนต์ AI ของคุณ ตอนนี้คุณสามารถออกคำสั่งด้วยภาษาธรรมชาติเพื่อควบคุมเบราว์เซอร์ได้แล้ว นี่คือตัวอย่างบางส่วน:

นำทางไปยัง URL:

https://example.com

คลิกปุ่ม:

"คลิกปุ่ม 'Sign Up'"

กรอกแบบฟอร์ม:

user@example.com

จับภาพหน้าจอ:

"จับภาพหน้าจอของหน้าแรก"

ดึงข้อมูล:

"ดึงชื่อผลิตภัณฑ์ทั้งหมดจากหน้านี้"

AI จะแปลคำสั่งเหล่านี้ให้เป็นการกระทำของเบราว์เซอร์โดยใช้ Browserbase MCP Server

ขั้นตอนที่ 3: ดูผลลัพธ์

ขึ้นอยู่กับคำสั่ง AI จะส่งคืนผลลัพธ์เช่น:

ตัวอย่างเช่น หากคุณขอภาพหน้าจอ AI อาจตอบกลับมาว่า:

"จับภาพหน้าจอแล้วบันทึกเป็น 'homepage.png'"

การทดสอบ Browserbase MCP Server

มาทดสอบด้วยตัวอย่างจริงกัน สมมติว่าคุณต้องการทำให้การค้นหาบนเว็บไซต์เป็นอัตโนมัติ

  1. เปิดไคลเอนต์ AI ของคุณ: สำหรับตัวอย่างนี้ เราจะใช้ Claude Desktop
  2. ออกคำสั่ง:
https://google.com

3. สังเกตเบราว์เซอร์: หากคุณกำลังรันในเครื่องด้วย HTTP transport คุณอาจเห็นเบราว์เซอร์เปิดขึ้นและดำเนินการตามคำสั่ง

4. ตรวจสอบการตอบสนอง: Claude ควรยืนยันการกระทำและอาจดึงชื่อหน้าหรือเนื้อหาออกมา

การทดสอบง่ายๆ นี้แสดงให้เห็นว่า Browserbase MCP Server ช่วยให้ AI ควบคุม Chrome เพื่อทำงานบนเว็บได้อย่างไร

ติดตั้ง Claude

เคล็ดลับการแก้ไขปัญหา

บทสรุป

และนี่คือทั้งหมด! คุณได้เรียนรู้วิธีใช้ Browserbase MCP Server เพื่อควบคุมเบราว์เซอร์ Chrome ด้วย AI แล้ว ไม่ว่าคุณจะเลือกเส้นทางแบบโฮสต์เพื่อความเรียบง่าย, npm หรือการตั้งค่าในเครื่องเพื่อการควบคุม ตอนนี้คุณก็พร้อมที่จะทำให้งานบนเว็บเป็นอัตโนมัติเหมือนมืออาชีพแล้ว Browserbase MCP Server เป็นเครื่องมือที่ทรงพลังที่นำ AI และระบบอัตโนมัติบนเว็บมารวมกัน เปิดโอกาสไม่รู้จบสำหรับนวัตกรรม

พร้อมที่จะสำรวจเพิ่มเติมหรือไม่? ลองทำให้งานบนเว็บประจำวันของคุณเป็นอัตโนมัติ หรือนำไปรวมเข้ากับโปรเจกต์ AI ถัดไปของคุณ

💡
ต้องการเครื่องมือทดสอบ API ที่ยอดเยี่ยมซึ่งสร้าง เอกสาร API ที่สวยงาม ใช่ไหม?

ต้องการแพลตฟอร์มแบบ All-in-One ที่ครบวงจรสำหรับทีมพัฒนาของคุณ เพื่อทำงานร่วมกันด้วย ประสิทธิภาพสูงสุด ใช่ไหม?

Apidog ตอบสนองทุกความต้องการของคุณ และ เข้ามาแทนที่ Postman ในราคาที่ย่อมเยาลงมาก!
ปุ่ม

ฝึกการออกแบบ API แบบ Design-first ใน Apidog

ค้นพบวิธีที่ง่ายขึ้นในการสร้างและใช้ API