Comment créer une automatisation de navigateur intelligente avec Python, Ollama et DeepSeek

Apprenez à créer des agents d'automatisation de navigateur IA robustes avec Python, Browser Use, Ollama et DeepSeek. Ce guide étape par étape couvre la configuration, les exemples de code et la manière dont Apidog assure une intégration d'API fiable pour les développeurs et les équipes QA.

Ashley Goolam

Ashley Goolam

23 June 2026

Comment créer une automatisation de navigateur intelligente avec Python, Ollama et DeepSeek

Apidog pour les entreprises

Déploiement sur site

SSO & RBAC

Conforme SOC 2

Découvrir Apidog Enterprise
bouton

L'automatisation moderne des navigateurs évolue rapidement. L'époque des scripts Selenium fragiles et des flux de travail délicats est révolue. Grâce à des outils open source comme Browser Use, combinés à des hôtes LLM locaux tels qu'Ollama et à des moteurs de raisonnement avancés comme DeepSeek, les développeurs peuvent désormais créer des agents IA capables de naviguer sur le web, d'interagir avec des formulaires, d'extraire des données et d'automatiser des tâches de manière fiable, le tout grâce à des instructions en langage naturel.

Dans ce guide, vous apprendrez à configurer cette pile puissante, à comprendre le rôle de chaque composant et à écrire un agent IA basé sur Python capable de contrôler votre navigateur par programmation. Que vous soyez un développeur d'API, un ingénieur backend ou un spécialiste QA, cette approche ouvre de nouvelles possibilités pour une automatisation de navigateur robuste, privée et évolutive.

Pourquoi choisir Browser Use, Ollama et DeepSeek pour l'automatisation de navigateur par IA ?

Ensemble, ces outils vous permettent de créer des agents IA capables de :

Prérequis : Configuration de votre environnement de développement

Avant de commencer, assurez-vous que votre système répond aux exigences suivantes :

Conseil : Installez tous les composants manquants pour éviter les problèmes de configuration ultérieurs.

Configuration étape par étape : Création de votre projet d'automatisation de navigateur par IA

1. Organiser votre projet

Créez un dossier dédié pour votre travail :

mkdir browser-use-agent
cd browser-use-agent

2. Cloner le dépôt Browser Use

git clone https://github.com/browser-use/browser-use.git
cd browser-use

3. Créer et activer un environnement virtuel Python

Cela permet d'isoler les dépendances :

python -m venv venv
# Activate:
# Mac/Linux:
source venv/bin/activate
# Windows:
venv\Scripts\activate

Vous verrez (venv) dans votre terminal, confirmant l'activation.

4. Ouvrir votre projet dans VS Code

VS Code offre une excellente intégration Python :

code .

Vous n'avez pas VS Code ? Téléchargez-le ou utilisez votre éditeur préféré.

Installation d'Ollama et DeepSeek localement

1. Installer Ollama

Téléchargez et installez depuis ollama.com. Après l'installation, confirmez que cela fonctionne :

ollama --version
télécharger ollama

2. Télécharger le modèle DeepSeek

Pour un raisonnement de haute qualité, utilisez le modèle DeepSeek « seed » :

ollama pull deepseek/seed
ollama list

Recherchez deepseek-r1 ou le modèle que vous avez choisi.

télécharger le modèle deepseek

Installation de Browser Use et des dépendances requises

1. Installer Browser Use et les outils de développement

Dans votre environnement virtuel, exécutez :

pip install . ."[dev]"

2. Ajouter l'intégration LangChain et Ollama

pip install langchain langchain-ollama

Ces packages connectent votre agent au LLM local.

3. Installer Playwright pour l'automatisation du navigateur

playwright install

Si vous rencontrez des problèmes, assurez-vous que Python 3.11+ est actif, ou exécutez :

playwright install-deps

Configuration de la pile : Connecter Browser Use à Ollama et DeepSeek

Démarrez le serveur Ollama dans un terminal séparé :

ollama serve

Cela lance le serveur LLM à l'adresse http://localhost:11434. Laissez-le fonctionner pendant que vous travaillez.

Exemple : Créer un agent IA pour vérifier la météo de Boston sur Google

Créons un script Python qui ordonne à votre agent IA d'utiliser Google pour récupérer la météo de Boston.

  1. Créez test.py dans le dossier de votre projet et ajoutez :
import os
import asyncio
from browser_use import Agent
from langchain_ollama import ChatOllama

# Task: Use Google to find the weather in Boston, Massachusetts
async def run_search() -> str:
    agent = Agent(
        task="Use Google to find the weather in Boston, Massachusetts",
        llm=ChatOllama(
            model="deepseek/seed",
            num_ctx=32000,
        ),
        max_actions_per_step=3,
        tool_call_in_content=False,
    )
    result = await agent.run(max_steps=15)
    return result

async def main():
    result = await run_search()
    print("\n\n", result)

if __name__ == "__main__":
    asyncio.run(main())
  1. Assurez-vous que VS Code utilise l'interpréteur Python de votre environnement virtuel
    • Appuyez sur Ctrl+P (ou Cmd+P sur Mac)
    • Tapez > Select Python Interpreter
    • Choisissez l'interpréteur .venv de votre projet
  2. Exécutez le script :
python test.py

L'agent lancera un navigateur, recherchera la météo de Boston sur Google et affichera le résultat.

recherche browser-use

Si vous voyez une erreur, confirmez qu'Ollama est en cours d'exécution (ollama serve) et que le port 11434 est ouvert. Pour le dépannage, consultez les logs dans ~/.ollama/logs.

résultat de la recherche browser-use

Intégration d'Apidog : Tests d'API fiables pour les agents IA de navigateur

Lorsque votre agent IA de navigateur interagit avec des API web — comme l'extraction de données à partir d'endpoints ou l'automatisation de flux de travail basés sur des API — la validation fiable des contrats d'API devient essentielle.

Comment Apidog peut aider :

Apidog s'intègre en douceur dans les pipelines d'automatisation des navigateurs, vous permettant de vérifier que les API sur lesquelles votre agent s'appuie sont robustes et cohérentes.

Commencez à utiliser Apidog gratuitement pour renforcer vos flux de travail IA de navigateur.

Tests de contrat d'API avec Apidog

Tests de contrat d'API avec Apidog

bouton

Conseils pour une ingénierie de prompt efficace

Obtenez une automatisation plus précise en élaborant des invites claires et spécifiques :

Débogage et dépannage

Foire aux questions

Q1. Qu'est-ce que Browser Use ?
Un package Python pour l'automatisation de navigateur basée sur l'IA utilisant Playwright. GitHub

Q2. Ai-je besoin d'un GPU ?
Non requis pour les petits modèles comme DeepSeek/seed, mais les GPU accélèrent les modèles plus grands.

Q3. Puis-je utiliser d'autres modèles que DeepSeek ?
Oui, tout modèle capable de raisonner et supporté par Ollama peut fonctionner. GitHub

Q4. Mes données sont-elles traitées localement ?
Oui. L'exécution d'Ollama conserve les données et l'inférence sur votre machine, sauf configuration contraire. Chrome Web Store

Q5. Puis-je automatiser les connexions et les tâches multi-étapes ?
Absolument — définissez simplement votre tâche de haut niveau, et l'agent IA la décomposera.

Conclusion

Avec Python, Browser Use, Ollama et DeepSeek, vous pouvez construire des agents IA robustes qui automatisent de véritables navigateurs en utilisant des instructions en langage naturel. Cette pile est idéale pour les équipes axées sur les API qui ont besoin d'une automatisation fiable, privée et puissante — que ce soit pour le QA, l'intégration backend ou les tests avancés.

Ajoutez Apidog à votre flux de travail pour valider et tester les API avec lesquelles vos agents interagissent, en vous assurant que votre automatisation fonctionne toujours comme prévu.

Prêt à construire des agents de navigation intelligents ? Commencez dès aujourd'hui et rationalisez votre automatisation web en toute confiance.

bouton

Pratiquez le Design-first d'API dans Apidog

Découvrez une manière plus simple de créer et utiliser des API