Qwen 3.7 Plus é o modelo de agente multimodal da Alibaba: texto, imagem e vídeo como entrada, um contexto de 1M de tokens e um preço econômico. Como ele é fornecido apenas como uma API, as questões práticas são imediatas. Como eu consigo uma chave, como eu envio uma imagem e qual é o custo? Este guia responde a todas as três.
Abordaremos o acesso, como obter uma chave, sua primeira requisição em Python, curl e JavaScript, o formato de payload multimodal, a detalhada estrutura de preços com exemplos de custos e os limites de taxa. Ao longo do caminho, você usará o Apidog para disparar requisições de teste, inspecionar respostas brutas e simular o endpoint para que seu aplicativo continue em desenvolvimento. Se você quiser as capacidades e benchmarks primeiro, comece com nossa visão geral do Qwen 3.7 Plus; para o carro-chefe apenas de texto, veja o guia da API base do Qwen 3.7.
TL;DR
O Qwen 3.7 Plus é executado através do Alibaba Cloud Model Studio em um endpoint compatível com OpenAI. Você define uma URL base de região, passa sua chave como um token Bearer e chama /chat/completions com um ID de modelo qwen3.7-plus. Requisições multimodais adicionam partes de imagem ou vídeo ao conteúdo da mensagem. O preço é de US$ 0,40 por milhão de tokens de entrada e US$ 1,60 por milhão de tokens de saída, com entrada em cache a US$ 0,08, aproximadamente seis vezes mais barato que o Qwen3.7-Max. Não há um nível gratuito perpétuo, embora novas contas recebam uma cota gratuita única. Os tokens de visão compartilham o orçamento de contexto, então imagens e vídeo aumentam sua conta. Confirme o ID exato do modelo na documentação do Model Studio antes de implantar.
Como acessar o Qwen 3.7 Plus
Ao contrário do carro-chefe de texto, que passou seus primeiros dias por trás de uma prévia apenas de chat, o Plus é uma API comercial desde o primeiro dia. Duas superfícies importam.

Qwen Chat (chat.qwen.ai). A maneira mais rápida de experimentar o Plus com uma imagem. Faça login, escolha o modelo Plus, adicione uma captura de tela e veja como ele se contextualiza. É para avaliação, não para integração.
Alibaba Cloud Model Studio (DashScope). Esta é a API real. O Model Studio expõe o Plus através de um endpoint compatível com OpenAI, então qualquer código que já se comunique com o SDK do OpenAI pode chamá-lo com uma troca de URL base e chave.
Um limite rígido a ser considerado: o Plus é proprietário. Não há pesos abertos para download, então você não pode auto-hospedar ou executá-lo isolado. Se isso for um requisito, nossa visão geral do Qwen 3.7 Plus cobre o assunto em detalhes.
| Método | Acesso à API | Custo | Melhor para |
|---|---|---|---|
| Qwen Chat (chat.qwen.ai) | Não | Gratuito, com limite de taxa | Avaliação rápida com imagens |
| Model Studio (DashScope) | Sim, compatível com OpenAI | Pagamento por token | Integração em produção |
| Auto-hospedagem | Não | n/a | Não disponível; pesos são fechados |
Como obter uma chave API do Qwen 3.7 Plus
O acesso é feito através de uma conta Alibaba Cloud.
- Crie uma conta Alibaba Cloud e abra o console do Model Studio (
modelstudio.console.alibabacloud.com). - Ative o Model Studio para sua conta e região. As chaves são restritas à região, então uma chave de Singapura não autenticará contra Pequim.
- Abra a seção de chaves da API e gere uma chave. Ela se parece com
sk-seguido por uma string. - Copie-a uma vez e armazene-a como uma senha.
Sua região define sua URL base:
| Região | URL Base |
|---|---|
| Singapura | https://dashscope-intl.aliyuncs.com/compatible-mode/v1 |
| EUA (Virgínia) | https://dashscope-us.aliyuncs.com/compatible-mode/v1 |
| Pequim (China) | https://dashscope.aliyuncs.com/compatible-mode/v1 |
Mantenha a chave fora do controle de versão. Use uma variável de ambiente:
# macOS / Linux
export DASHSCOPE_API_KEY="sk-your-key-here"
# Windows PowerShell
setx DASHSCOPE_API_KEY "sk-your-key-here"
Sua primeira requisição: Python, curl e JavaScript
O endpoint é compatível com OpenAI, então você pode usar o SDK oficial do OpenAI apontando para a URL base do DashScope, ou uma chamada HTTP pura. O ID do modelo é qwen3.7-plus, mas confirme a string atual na lista de modelos do Model Studio antes de implantar, pois os identificadores podem mudar.
Python com o SDK do OpenAI
Instale com pip install openai, então:
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ["DASHSCOPE_API_KEY"],
base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)
resp = client.chat.completions.create(
model="qwen3.7-plus",
messages=[{"role": "user", "content": "Summarize the Qwen 3.7 Plus pricing model in two sentences."}],
)
print(resp.choices[0].message.content)
curl
curl "https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions" \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3.7-plus",
"messages": [{"role": "user", "content": "Hello from the Qwen 3.7 Plus API."}]
}'
JavaScript
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.DASHSCOPE_API_KEY,
baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});
const resp = await client.chat.completions.create({
model: "qwen3.7-plus",
messages: [{ role: "user", content: "Hello from the Qwen 3.7 Plus API." }],
});
console.log(resp.choices[0].message.content);
Enviando imagens e vídeo
A razão para usar o Plus em vez do Max é a entrada multimodal. Você passa o conteúdo visual como partes extras no array content da mensagem, o mesmo formato usado pela API de visão do OpenAI.
resp = client.chat.completions.create(
model="qwen3.7-plus",
messages=[{
"role": "user",
"content": [
{"type": "text", "text": "Which button submits this form? Give pixel coordinates."},
{"type": "image_url", "image_url": {"url": "https://example.com/screenshot.png"}},
],
}],
)
Você pode passar uma imagem como uma URL pública ou uma URI de dados base64. O vídeo segue o mesmo padrão com uma parte de vídeo. Isso é o que alimenta o comportamento de contextualização da GUI: dê ao Plus uma captura de tela, e ele retornará ações estruturadas como click at (x=487, y=232). Os nomes exatos das partes para vídeo podem diferir por região, então verifique a documentação de compatibilidade com OpenAI para o esquema atual.
Preços
O Plus é precificado como um nível multimodal econômico. Veja como ele se compara ao carro-chefe de texto.
| Modelo | Entrada / 1M | Saída / 1M | Entrada em cache / 1M |
|---|---|---|---|
| Qwen 3.7 Plus | $0.40 | $1.60 | $0.08 |
| Qwen 3.7 Max | $2.50 | $7.50 | $0.25 |
Isso é aproximadamente seis vezes mais barato que o Max na entrada. Não há um nível gratuito perpétuo, mas novas contas do Model Studio recebem uma cota gratuita de tokens única (geralmente na região de Singapura) para avaliar o modelo antes que a cobrança mude para pay-as-you-go. Observe que o antigo caminho gratuito do Qwen OAuth foi desativado em 15 de abril de 2026, então não se baseie nele. Os números oficiais estão na página de preços do Model Studio e no guia de cota gratuita; para maneiras de custo zero de experimentar a família mais ampla, consulte nosso guia Qwen 3.7 gratuito.
Quanto as requisições realmente custam
Texto é barato. Visão é onde a conta aumenta, porque imagens e vídeos são convertidos em tokens que compartilham a mesma taxa por token e o mesmo orçamento de contexto de 1M. Uma captura de tela de alta resolução pode chegar a alguns milhares de tokens, e os quadros de vídeo se acumulam rapidamente.
| Requisição | Tokens de entrada | Tokens de saída | Custo aprox. |
|---|---|---|---|
| Prompt apenas de texto | 10,000 | 2,000 | ~$0.007 |
| Uma captura de tela 1080p + prompt | ~1,500 | 300 | ~$0.001 |
| Vídeo de 30s amostrado a 2 fps | ~77,000 | 500 | ~$0.032 |
Os valores de tokens por quadro são aproximados e dependem da resolução e taxa de amostragem, mas a lição permanece: um agente de texto no Plus custa quase nada, enquanto uma carga de trabalho pesada em vídeo pode custar 30 vezes mais por chamada. Dimensione capturas de tela e amostre vídeos com moderação. Para uma estratégia de custo mais ampla, veja nossas notas sobre como reduzir os custos de token do agente e a guerra de preços chinesa de LLMs de 2026 que colocou o Plus neste preço em primeiro lugar.
Limites de taxa e erros
O Model Studio impõe limites de taxa por conta em requisições por minuto e tokens por minuto, e os tetos dependem do seu nível de conta e região, em vez de um único número publicado. Verifique a página de cotas no console para seus limites atuais e solicite um aumento lá se você os atingir.
Lide com as falhas comuns:
- 401 Não Autorizado: chave errada ou uma chave da região errada para sua URL base.
- 429 Muitas Requisições: você atingiu o limite de taxa. Recue e tente novamente com atraso exponencial.
- 400 Requisição Inválida: geralmente um payload multimodal malformado, uma imagem grande demais ou um estouro de contexto uma vez que os tokens de visão são contados.
Envolva as chamadas em uma tentativa de repetição com recuo em 429 e 5xx, e valide o tamanho da imagem antes de enviar.
Teste e simule a API com Apidog
Requisições multimodais são fáceis de errar. Você está codificando imagens em base64, aninhando arrays de conteúdo e lendo planos de ação estruturados, muitas vezes dentro de um loop de chamada de ferramenta. Visualizar isso em um terminal fica tedioso rapidamente.

Apidog oferece um espaço de trabalho real para isso. Envie requisições do Qwen 3.7 Plus com partes de imagem e vídeo, inspecione a resposta JSON bruta, armazene sua chave do Model Studio por ambiente para nunca colá-la no código e simule o endpoint para que seu frontend seja construído enquanto você ajusta os prompts. Quando o Plus está encadeando chamadas de ferramentas em uma execução de agente GUI e CLI, o depurador de agente de IA do Apidog mostra a sequência completa para que você possa encontrar onde uma execução falhou.
Baixe o Apidog para testar, depurar e simular a API do Qwen 3.7 Plus antes que ela chegue à produção.
Perguntas Frequentes
Existe um nível gratuito para a API Qwen 3.7 Plus? Não há um nível gratuito perpétuo. Novas contas do Alibaba Cloud Model Studio recebem uma cota gratuita de tokens única para avaliação, geralmente na região de Singapura, então a cobrança muda para pagamento por uso.
Qual é o ID do modelo? qwen3.7-plus no Model Studio. Como os identificadores podem mudar, confirme a string atual na lista de modelos do Model Studio antes de implantar.
Como o custo de imagem e vídeo é calculado? O conteúdo visual é convertido em tokens cobrados na taxa de entrada padrão. Uma captura de tela 1080p pode custar alguns milhares de tokens, e o vídeo adiciona tokens por quadro amostrado, então grandes payloads de mídia dominam a conta.
Como a API difere do Qwen 3.7 Max? O mesmo formato compatível com OpenAI e URLs base. O Plus aceita partes de imagem e vídeo no conteúdo da mensagem e custa cerca de seis vezes menos; o Max é apenas de texto e mantém uma pequena vantagem em benchmarks de texto puro.
Posso auto-hospedar o Qwen 3.7 Plus? Não. Os pesos são fechados, então ele é executado apenas através do Alibaba Cloud Model Studio.
Qual URL base devo usar? Aquela que corresponde à região onde você criou sua chave: Singapura, EUA (Virgínia) ou Pequim. Uma chave não autenticará contra o endpoint de uma região diferente.
Conclusão
Chamar o Qwen 3.7 Plus é uma troca de URL base e chave no SDK do OpenAI, mais partes de imagem ou vídeo quando você precisa de visão. O preço é genuinamente barato para texto e escala com seu payload visual, então a disciplina está em quantos pixels você envia, não na própria API. Obtenha uma chave, envie sua primeira requisição multimodal e teste todo o fluxo no Apidog antes de conectá-lo à produção.
