알리바바는 2주 안에 Qwen 3.7 라인의 두 가지 플래그십 모델을 출시했습니다: 텍스트 전용 추론 모델인 Qwen3.7-Max와 시각 기능을 추가하고 가격은 훨씬 저렴한 멀티모달 버전인 Qwen3.7-Plus입니다. 이들은 동일한 1M 토큰 컨텍스트와 동일한 35시간의 자율 작동 한도를 공유하므로, 사양서만으로는 선택이 명확하지 않습니다.
이 가이드는 벤치마크, 가격, 속도, 그리고 일상적인 사용 결정 측면에서 두 모델을 나란히 비교합니다. 각 모델에 대한 배경 지식이 필요하다면, 저희의 Qwen 3.7 Plus 개요와 더 폭넓은 Qwen 3.7이란 무엇인가 가이드를 참조하세요. 어떤 모델을 선택하든 API를 통해 호출하고 응답을 테스트해야 합니다. 이때 Apidog가 유용하며, 이 내용은 마지막에 다룹니다.
간단히 말해서
Plus를 기본으로 사용하세요. 도구 사용에서 Max와 동등하며, 터미널 작업에서는 Max보다 우수하고, 이미지 및 비디오 입력을 추가하며, 비용은 약 6배 저렴합니다. 대부분의 워크로드에서 이 결정은 이미 가격만으로도 내려집니다.

텍스트에만 최적화하는 경우에만 Max를 선택하세요. Max는 순수 텍스트 리더보드에서 약간 앞서며, 텍스트 전용 콜드 스타트에서 약간 더 빠르게 실행됩니다. 작업에 스크린샷이나 문서 이미지가 전혀 포함되지 않는다면, 이러한 우위가 중요할 수 있습니다. 그 외의 모든 경우에는 Plus가 우수합니다.
핵심 차이점
Max는 순수 텍스트 플래그십입니다. 텍스트 입력만으로 추론하고, 코드를 작성하며, 긴 에이전트 체인을 실행합니다. Plus는 동일한 백본을 사용하고 여기에 눈을 추가했습니다. 즉, 이미지와 비디오를 받아들이고, 스크린샷에서 정확한 클릭 좌표를 반환할 수 있을 정도로 GUI를 잘 이해합니다. 그리고 가격 면에서 Max보다 저렴합니다.

따라서 절충점은 좁습니다. 약간의 텍스트 품질 및 지연 시간 우위를 포기하는 대신, 시각 기능과 훨씬 저렴한 비용을 얻습니다.
벤치마크
수치는 일관된 이야기를 들려줍니다. Plus는 순수 텍스트에서 Max보다 약간 뒤처지지만, 도구 사용에서는 동등하며, 시각 기능이 개입하는 순간 앞서 나갑니다.
| 벤치마크 | Qwen 3.7 Plus | Qwen 3.7 Max |
|---|---|---|
| LM 아레나 (텍스트) | #15 | #13 |
| LM 아레나 (코딩) | #12 | #10 |
| 비전 아레나 | #16 | 해당 없음 |
| SWE-벤치 프로 | ~60% | 60.6% |
| 터미널 벤치 (2.0 터미너스) | 70.3 | 69.7 |
| 스크린스팟 프로 (GUI 이해) | 79.0 | 없음 |
| MCP-아틀라스 (도구 사용) | 76.4 | 76.4 |
세 가지가 눈에 띕니다.
SWE-Bench Pro는 사실상 동점입니다. Plus는 Max의 60.6%에 비해 약 60%를 기록합니다. 실제 소프트웨어 작업에서 시각 매개변수는 Plus의 코딩 능력에 의미 있는 손실을 주지 않습니다. 저희의 Qwen 3.7 vs GPT-5.5 vs Opus 4.7 비교는 서구 플래그십 모델들과 비교했을 때 이들이 어느 위치에 있는지 보여줍니다.
Plus는 실제로 터미널 벤치에서 승리했습니다. 70.3 대 69.7. 셸 중심 에이전트 작업의 경우, 더 저렴한 모델이 약간 더 강력합니다.
GUI 이해 능력은 진정한 차별점입니다. ScreenSpot Pro 79.0은 최전선 수준이며, Max는 이를 전혀 실행할 수 없습니다. 에이전트가 화면을 봐야 한다면, 이 모델들 중 하나만이 적합합니다. 언제나 그렇듯이, 공급업체의 벤치마크 수치는 복음이 아닌 방향성으로 취급해야 합니다. SWE-bench 사이트는 각 스위트가 무엇을 측정하는지 설명합니다.
가격
여기서 격차가 큽니다.
| Qwen 3.7 Plus | Qwen 3.7 Max | |
|---|---|---|
| 입력 / 100만 토큰 | $0.40 | $2.50 |
| 출력 / 100만 토큰 | $1.60 | $7.50 |
| 캐시된 입력 / 100만 토큰 | $0.08 | $0.25 |
Plus는 입력에서 약 6배, 출력에서 거의 5배 더 저렴합니다. 대용량 또는 장기 실행 에이전트의 경우, 이 비율이 예산을 결정합니다. 더 저렴한 모델은 이미지도 읽을 수 있으므로, 텍스트 우위가 특별히 필요하지 않다면 Max는 설득하기 어렵습니다.
Plus의 한 가지 주의사항: 이미지와 비디오는 토큰화되어 1M 컨텍스트 예산을 공유하므로, 스크린샷이 많거나 비디오 워크로드의 경우 호출당 토큰당 요율보다 더 많은 비용이 소모됩니다. 이미지를 축소하고 비디오 샘플링을 아껴서 사용하세요. 에이전트 토큰 비용 절감에 대한 저희의 참고 자료와 2026년 중국 LLM 가격 전쟁은 더 넓은 비용 그림을 다룹니다. 공식 요율은 모델 스튜디오 가격 페이지에서 확인할 수 있습니다.
사양 및 속도
| Qwen 3.7 Plus | Qwen 3.7 Max | |
|---|---|---|
| 입력 양식 | 텍스트, 이미지, 비디오 | 텍스트 전용 |
| 컨텍스트 창 | 1M (시각 기능과 공유) | 1M |
| 자율 실행 한도 | 35시간 | 35시간 |
| 텍스트 전용 지연 시간 | 기준선 | 콜드 경로에서 약 7–15% 더 빠름 |
| 가중치 | 독점, API 전용 | 독점, API 전용 |
지연 시간은 Max의 조용한 장점입니다. 텍스트 전용 콜드 스타트에서 눈에 띄게 더 빠르게 응답하며, 이는 사용자에게 첫 토큰까지의 시간이 보이는 채팅 스타일 제품에서 중요합니다. 독립적인 분석은 속도와 지능의 절충점을 상세히 추적합니다. 두 모델 모두 폐쇄형 가중치를 사용하며 Alibaba Cloud Model Studio를 통해서만 실행되므로, 자체 호스팅이 필요한 경우에는 어느 모델도 선택지가 될 수 없습니다.
어떤 모델을 선택해야 할까요?
**Qwen 3.7 Plus**를 선택해야 하는 경우:
- 작업에 이미지, 스크린샷, PDF 또는 비디오가 포함되는 경우.
- 화면을 읽는 컴퓨터 사용 또는 GUI 에이전트를 구축하는 경우.
- 비용이 중요한 경우 (이 수치를 보면 거의 항상 그렇습니다).
**Qwen 3.7 Max**를 선택해야 하는 경우:
- 순수하게 텍스트 전용 SWE-Bench Pro 점수를 위해 조정하는 경우.
- 지연 시간에 민감한 제품에서 가장 빠른 텍스트 응답이 필요한 경우.
- 시각적 입력을 전혀 보내지 않고 텍스트 품질의 모든 포인트를 원하는 경우.
대부분의 팀에게 Plus는 합리적인 기본 선택이며 Max는 전문가용입니다. 비용 격차가 너무 커서 텍스트 전용 모델에 6배 더 많은 비용을 지불하려면 구체적인 이유가 필요할 것입니다.
더 구체적으로 설명하기 위해, 일반적인 워크로드가 어떻게 매핑되는지 살펴보겠습니다:
| 워크로드 | 선택 | 이유 |
|---|---|---|
| 스크린샷 QA 또는 시각적 회귀 에이전트 | Plus | GUI 이해 필요; Plus만이 화면을 볼 수 있습니다 |
| 송장, 영수증 또는 스캔된 PDF 추출 | Plus | 문서 이미지는 시각적 입력이 필요합니다 |
| 대량 텍스트 분류 | Plus | 동일한 텍스트 품질, 훨씬 저렴한 비용 |
| 저지연 고객 지원 챗봇 | Max | 더 빠른 텍스트 전용 콜드 스타트가 사용자에게 중요합니다 |
| 긴 자율 코딩 실행 | 둘 중 하나 | SWE-Bench Pro에서 동점이므로 비용으로 결정 |
패턴은 반복됩니다: 워크로드가 텍스트 전용이거나 지연 시간에 민감하지 않다면, 더 저렴한 멀티모달 모델이 더 안전한 기본 선택입니다.
Apidog로 두 모델 테스트하기
두 모델은 동일한 OpenAI 호환 Model Studio 엔드포인트를 공유하므로, 모델 ID 한 줄만 변경하면 서로 전환할 수 있습니다. 이는 두 모델을 직접 비교하기 쉽게 만듭니다. 동일한 프롬프트를 qwen3.7-plus와 qwen3.7-max에 보내고, 응답을 나란히 비교하여 가격 차이가 작업에 합당한지 확인할 수 있습니다.

Apidog는 이러한 루프를 위해 구축되었습니다. 두 모델에 요청을 보내고, 원시 JSON을 나란히 검사하고, 환경별로 Model Studio 키를 저장하며, 엔드포인트를 모의하여 앱을 계속 구축할 수 있습니다. 멀티모달 Plus 요청의 경우, 저희의 Qwen 3.7 Plus API 가이드는 이미지 및 비디오 페이로드 형식을 보여주며, 기본 Qwen 3.7 API 가이드는 텍스트 경로를 다룹니다. 어느 모델이 에이전트 실행에서 도구 호출을 연결하는 경우, Apidog의 AI 에이전트 디버거가 전체 시퀀스를 보여줍니다.
프로덕션에 연결하기 전에 두 Qwen 3.7 모델을 테스트하고 비교하려면 Apidog를 다운로드하세요.
자주 묻는 질문
Qwen 3.7 Plus가 Max보다 낫습니까? 대부분의 워크로드에서는 그렇습니다. 시각 기능을 추가하고 코딩 및 도구 사용에서 Max와 동등하면서도 비용이 훨씬 저렴하기 때문입니다. Max는 순수 텍스트 리더보드와 텍스트 전용 지연 시간에서 약간의 우위를 유지합니다.
Plus는 얼마나 저렴합니까? 입력에서 약 6배 ($0.40 대 $2.50 / 100만 토큰), 출력에서 거의 5배 저렴합니다 ($1.60 대 $7.50).
동일한 컨텍스트 창을 공유합니까? 네, 둘 다 1M 토큰 창을 가지고 있습니다. Plus의 경우, 이미지와 비디오가 동일한 예산에서 토큰을 소비합니다.
Max는 이미지를 처리할 수 있습니까? 아니요. Max는 텍스트 전용입니다. 이미지 또는 비디오 입력이 필요한 경우 Plus가 필요합니다.
둘 중 하나라도 오픈 소스입니까? 아니요. 둘 다 독점적이며 Alibaba Cloud Model Studio를 통해서만 실행됩니다. 가중치를 다운로드하거나 자체 호스팅할 수 없습니다.
어느 쪽이 더 빠릅니까? Max는 텍스트 전용 콜드 경로에서 약 7~15% 더 빠릅니다. 혼합 또는 시각 작업의 경우, 어쨌든 Plus가 유일한 옵션입니다.
결론
Qwen 3.7 Max와 Plus는 사실상 같은 작업을 두고 경쟁하는 것이 아닙니다. Max는 속도 및 품질 면에서 미세한 우위를 가진 텍스트 순수주의자이며, Plus는 가격이나 시각 기능이 중요한 거의 모든 곳에서 승리하는 더 저렴한 멀티모달 제너럴리스트입니다. Plus로 시작하고, 텍스트 전용 워크로드가 프리미엄을 정당화할 때만 Max를 고려하세요. 어떤 경우든, Apidog에서 API를 테스트하여 배포하는 것이 벤치마크가 약속하는 대로 작동하는지 확인하세요.
