強力なAIエージェントを毎日実行すると、高額なクラウド費用に直面します。Qwen3.5は、最先端のマルチモーダル推論をローカルで提供します。これをOpenClawと組み合わせることで永続的なエージェントワークフローを実現し、Ollamaを使用することでシンプルなローカルサービングが可能になります。その結果、サブスクリプションなしで24時間365日マシン上で動作する完全なAIエージェントが完成します。
小さな選択が重要です。適切なモデルタグを選択し、正しいベースURLを設定します。これらの決定が速度と信頼性に大きな違いを生み出します。このガイドでは、完全に制御できる本番環境対応のスタックを完成させるための正確な手順を示します。
Qwen3.5がローカルエージェント作業に最適な理由
Alibabaは2026年初頭に、初のネイティブビジョン言語モデルファミリーとして Qwen3.5 をリリースしました。397B-A17Bのフラッグシップモデルはハイブリッドアーキテクチャを採用しており、Gated Delta Networksと疎なMixture-of-Expertsを組み合わせています。トークンあたりわずか170億のパラメータがアクティブ化され、はるかに少ないメモリで強力なパフォーマンスを実現します。

Ollamaは今日プルできるこれらの実用的なタグをホストしています。
- qwen3.5:35b — 24 GB VRAMに収まり、256Kコンテキスト、完全なテキストおよび画像サポート
- qwen3.5:122b — より深い推論のために81 GBが必要
qwen3.5をローカルで実行し、データを非公開に保つことができます。このモデルはTAU2-Benchで86.7、MMMUで85.0を記録しています。そのため、テキスト、スクリーンショット、ツール呼び出しを組み合わせるエージェントタスクに信頼して使用できます。
OpenClawがQwen3.5を真のエージェントに変える方法
OpenClawは常時稼働するエージェントランタイムとして機能します。WhatsApp、Telegram、Slack、Discord、Signalに一度接続するだけで、エージェントは継続的にリッスンします。メッセージを送信すると、OpenClawはそれをqwen3.5にルーティングし、ツールを呼び出し、Playwrightでブラウザを制御し、ファイルを編集し、カレンダーを更新し、積極的に応答します。

セッション間でメモリを保存できます。エージェントはあなたのプロジェクトと好みを永続的に記憶します。コミュニティスキルをインストールしたり、必要に応じてqwen3.5に新しいスキルを作成させたりすることもできます。OpenClawは、決して眠らないあなたのパーソナルデジタルアシスタントとなるでしょう。
Ollamaが統合をシンプルにする理由
Ollamaはモデルをローカルで提供し、ポート11434でOpenAI互換のエンドポイントを公開します。OpenClawをhttp://localhost:11434/v1に向け、モデルをqwen3.5:35bに設定します。Ollamaが量子化、GPUオフロード、コンテキスト管理を自動的に処理します。
コンシューマハードウェアで高速なトークン生成を実現できます。qwen3.5が長時間のエージェント会話に必要とする完全な256Kコンテキストウィンドウを維持できます。同時に、クラウド費用とデータ漏洩を回避します。
満たすべき前提条件
開始する前にマシンを準備してください。macOS 14以降、Ubuntu 22.04/24.04、またはWSL2を備えたWindows 11を使用してください。35Bモデルには少なくとも24 GBのVRAM、またはApple Siliconでは32 GBのユニファイドメモリが必要です。30 GBの空きディスク容量を確保してください。Node.js 22以降およびOllama 0.17以降をインストールしてください。
後で1つのコマンドでGPUを確認します。これらの要件を満たすハードウェアは、応答性の高いパフォーマンスを提供します。メモリが少ない場合は、より小さな量子化モデルにフォールバックします。
OllamaをインストールしてQwen3.5をプルする
まずOllamaをインストールします。macOSでは以下を実行します。
brew install ollama
brew services start ollama
Linuxでは以下を実行します。
curl -fsSL https://ollama.com/install.sh | sh
systemctl enable --now ollama
ollama listでサービスが実行されていることを確認します。次に、モデルをプルします。
ollama pull qwen3.5:35b
ダウンロードは10分から30分で完了します。基本的な推論をテストします。
ollama run qwen3.5:35b
REPL内でプロンプトを入力します。Qwen3.5は正確に答えます。`/bye`で終了します。
OpenClawが必要とするため、OpenAI互換のエンドポイントをすぐに確認します。
curl http://localhost:11434/v1/models
応答にqwen3.5:35bが表示されます。ブリッジが機能していることがわかります。
Qwen3.5でOpenClawを起動する
1つのOllamaコマンドで全てをインストールし、開始します。
ollama launch openclaw --model qwen3.5:35b
Ollamaは不足しているコンポーネントをインストールし、ゲートウェイを起動し、TUIウィザードを開きます。メッセージングチャネルを接続し、モデルプロバイダーを確認し、設定を保存します。ゲートウェイはポート8080で実行されます。
Telegramでボットに「Downloadsフォルダのファイルをリストアップして。」とメッセージを送ってテストします。OpenClawはqwen3.5を使用して結果を返します。
手動で設定することもできます。`~/.openclaw/openclaw.json`を編集し、OllamaプロバイダーのベースURLを設定します。`openclaw start`で再起動します。どちらの方法も同じ結果をもたらします。
Apidogでフルスタックをテストする
Apidogを開き、「Qwen3.5 OpenClaw ローカルスタック」という新しいプロジェクトを作成します。ベースURLを`http://localhost:11434/v1`に設定します。

`/chat/completions`にPOSTリクエストを追加します。これらのヘッダーを含めます。
- Content-Type: application/json
- Authorization: Bearer ollama
このボディを使用します。
{
"model": "qwen3.5:35b",
"messages": [
{"role": "system", "content": "You are a helpful agent."},
{"role": "user", "content": "Plan steps to organize my Downloads folder by file type."}
],
"temperature": 0.7,
"max_tokens": 2048
}
リクエストを送信します。Apidogはリアルタイムでストリーミングトークンを表示します。ステータスコード200の視覚的なアサーションを追加します。リクエストをテストシナリオとして保存します。設定を変更した後、再度シナリオを実行します。これにより、問題を即座に特定できます。
`http://localhost:8080/v1`でOpenClawのゲートウェイ用に2番目のコレクションを作成します。エンドツーエンドのメッセージルーティングをテストします。Apidogのスキーマ検証により、ツール呼び出し形式がOpenClawの期待するものと一致することを確認します。
Apidogでエンドポイントを設計し、ドキュメント化する
Apidogのビジュアルデザイナーを使用して、チャット補完スキーマをモデル化します。公式のOpenAI仕様をインポートし、qwen3.5パラメータに合わせてカスタマイズします。インタラクティブなドキュメントを自動的に生成します。チームで作業する場合は、Apidogワークスペースを通じてチームメイトとドキュメントを共有できます。

Apidog内でモックレスポンスも作成します。OpenClawの完全なセットアップを完了する前にツール呼び出しをシミュレートできます。これにより、開発を高速化し、エッジケースを安全にテストできます。
パフォーマンス向上のための高度な構成
より軽量な量子化が必要な場合は、カスタムModelfileを作成します。
FROM qwen3.5:35b
PARAMETER num_gpu 999
PARAMETER num_ctx 131072
`ollama create qwen3.5:35b-q4 -f Modelfile`でビルドします。新しいタグを使用するようにOpenClawの設定を更新します。
チャットメッセージでbase64画像を送信することで、ビジョンを有効にします。Qwen3.5はOpenClawがブラウザタスク中にキャプチャしたスクリーンショットを処理します。これにより、視覚的な理解を必要とするフォームを自動化できます。
追加スキルをインストールします。
openclaw skill install @community/calendar
openclaw skill install @community/github
各スキルはJSONスキーマを登録します。Qwen3.5はそれらを自動的に呼び出すことを学習します。OpenClawダッシュボード内で使用状況を監視できます。
今日実行できる実際のワークフロー
このスタックをコードレビューに使用します。OpenClawに「私のリポジトリのPRをレビューし、リファクタリングを提案して。」とメッセージを送ります。エージェントはリポジトリをクローンし、コードを分析し、パッチを作成します。
個人タスクを自動化します。「受信トレイでフライト確認をチェックし、カレンダーに追加して。」と入力します。OpenClawはメールを解析し、カレンダーを更新します。
リサーチアシスタントを構築します。PDFのスクリーンショットを送信し、要約と追加の質問を依頼します。Qwen3.5はテキストを正確に抽出し、OpenClawは数日間にわたってコンテキストを保持します。
複数のエージェントを実行します。個別のOpenClawワークスペースを起動します。1つは一般的な作業にqwen3.5:35bを使用し、もう1つは専門的なコーダーモデルを使用します。ゲートウェイはメッセージを正しくルーティングします。
速度とメモリ使用量を最適化する
すべてのGPUレイヤーを使用するには`OLLAMA_NUM_GPU=999`を設定します。`nvidia-smi`で監視します。Apple Siliconではフラッシュアテンションを有効にします。
qwen3.5が自動的に実行する定期的な要約プロンプトを使用して、コンテキストの肥大化を軽減します。トークン/秒のレートを比較します。35Bモデルは4090クラスのGPUで45〜60トークン/秒に達します。ハードウェアに合ったバリアントを選択してください。
Apidogのパフォーマンステストを使用して、100リクエストにわたるレイテンシを測定します。目標の応答時間に達するまで、温度とmax_tokensを調整します。
一般的な問題を素早く解決する
「モデルが見つかりません」と表示された場合、`ollama list`を実行し、設定内のタグを修正します。
高レイテンシが発生した場合、`journalctl -u ollama`でログを確認し、GPUレイヤーを増やします。Apidogを使用して同じリクエストを再テストし、改善を確認します。
ツール呼び出しの解析に失敗した場合、Apidogのテストシナリオ内で温度を0.7に固定して再実行します。
OpenClawがメッセージングアプリへの接続を失った場合、`openclaw configure --section channels`を実行してトークンを更新します。
Ollamaでレート制限に達した場合、同時実行設定を増やしてApidogで再度テストします。
あらゆる問題に対してApidogのエラー検査ペインを使用します。視覚的なスタックトレースと応答比較により、修正が劇的に高速化されます。
設定を安全に保つ
OpenClawを専用のユーザーアカウントで実行します。ツール実行にはサンドボックスを有効にします。ポート11434または8080を公開することは決してありません。旅行中はSSHトンネルまたはTailscaleを介してアクセスします。
各スキルのソースをインストールする前に確認します。OpenClawの設定でメモリ暗号化を有効にします。`~/.openclaw`フォルダを定期的にバックアップします。
これにより、データがネットワークから離れることがないため、ほとんどのクラウドサービスよりも安全なシステムを運用できます。
将来のアップデートに備える
Alibabaはより小型のQwen3.5バリアントを定期的にリリースしています。Ollamaはそれらを迅速に追加します。`ollama pull qwen3.5:35b --force`でアップデートをプルします。
OpenClawのスキルライブラリは毎週増え続けています。GitHubの通知をチェックして最新の状態を維持してください。
アップデートごとにApidogのテストプロセスを繰り返します。テストコレクションを保持し、モデルタグを変更するだけで、余分な作業なしで信頼性を維持できます。
結論
これで、Ollamaを使用してQwen3.5をOpenClawと組み合わせて無料で実行できます。ハードウェア上のスタック全体を制御し、強力な推論、ビジョンサポート、永続的なメモリ、積極的な自動化を実現します。
明確な手順に従いました。Apidogですべてのレイヤーをテストし、パフォーマンスを最適化し、環境を安全にしました。小さな構成の選択が、有能なパーソナルAIエージェントを生み出しました。
今すぐターミナルを開いてください。起動コマンドを実行し、メッセージングアプリを接続してください。最初のタスクを送信すると、完全にローカルなエージェントがいかに強力であるかを感じられるでしょう。
Apidogをダウンロードして、今後のアップデートに対応し、エンドポイントを効率的にテストし続けてください。よりスマートなワークフローを構築するために必要なものは、すでにすべて揃っています。

