클로드 미토스: Anthropic, 출시하기 너무 위험한 모델이라고 밝혀

요약

Claude Mythos Preview는 대중에게 공개되지 않고 Project Glasswing을 통해 테스트 중인 제한적인 Anthropic 모델로 보입니다. Project Glasswing은 사이버 보안에 중점을 둔 미리 보기 프로그램입니다. 보고된 벤치마크 수치는 소프트웨어 엔지니어링 작업에서 Claude Opus 4.6보다 훨씬 강력할 수 있음을 시사하지만, Anthropic은 이를 광범위하게 출시하지 않았습니다. 그럴 가능성이 높은 이유는 이중 용도 위험(dual-use risk) 때문입니다. 즉, 방어자를 돕는 모델이 공격자에게도 도움이 될 수 있기 때문입니다.

서론

모든 주요 AI 연구소는 안전을 진지하게 다룬다고 말합니다. 하지만 가능한 한 빨리 강력한 모델을 시장에 출시하기보다는, 이를 보류함으로써 안전을 증명하는 연구소는 거의 없습니다.

이것이 바로 Claude Mythos Preview가 흥미로운 이유입니다. Anthropic은 일반적인 Claude 출시처럼 이를 발표하지 않았습니다. 광범위한 공개 API 출시도, 표준 채팅 제품 출시도, 모두를 위한 즐거운 "지금 사용해 보기" 페이지도 없습니다. 대신, 이 모델은 방어적 사이버 보안 작업에 중점을 둔 제한적인 프로그램인 Project Glasswing과 관련된 보도를 통해 드러났습니다.

그것만으로도 사람들의 이목을 끌기에 충분합니다. 그러나 Claude Mythos Preview에 첨부된 벤치마크 수치는 이 이야기를 훨씬 더 크게 만듭니다. 보고된 결과는 SWE-Bench 스타일 코딩 작업에서 Claude Opus 4.6보다 크게 도약했음을 시사합니다. 만약 이 수치들이 사실이라면, Anthropic은 이미 공격 및 방어 사이버 역량 간의 균형을 실질적으로 변화시킬 수 있는 모델을 보유하고 있을 수 있습니다.

💡

AI 모델 출시에 대한 도구를 구축한다면, 이것은 API 우선 테스트가 중요한 상황의 정확한 예시입니다. 연구소는 대중에게 공개되기 훨씬 전에 제한된 파트너들에게 모델을 노출할 수 있습니다. Apidog은 팀이 이러한 미래 API 흐름을 모델링하고, 제한된 액세스 엔드포인트를 모의하며, 더 넓은 액세스가 열리기 전에 통합 로직을 테스트하도록 돕습니다. 완전한 공개 출시를 기다리지 않고 AI 모델 통합을 프로토타입화하고 싶다면 Apidog을 무료로 다운로드하세요.

button

Claude Mythos Preview란 무엇인가?

현재 보도에 따르면, Claude Mythos Preview는 아직 출시되지 않은 Anthropic 모델로, 선정된 방어적 사이버 보안 파트너 및 연구자에게만 제공되고 있습니다.

그 표현이 중요합니다.

이는 Sonnet이나 Opus와 같은 표준 Claude 제품군 출시와는 다릅니다. 오히려 특정 사용 사례에 맞춰 액세스가 제한된 통제된 미리 보기 모델에 가깝습니다. 로이터 통신은 Anthropic이 Project Glasswing 하에 Amazon, Microsoft, Apple, Google, Nvidia, CrowdStrike, Palo Alto Networks를 포함한 주요 파트너들과 협력하고 있다고 보도했습니다. 그 목적은 대량 소비자 접근이 아닌 방어적 사이버 보안 연구입니다.

따라서 현재 가장 명확한 설명은 다음과 같습니다. Claude Mythos Preview는 대중에게 공개되는 Claude 등급이 아닌, 방어 보안 작업을 위한 접근이 제한된 Anthropic 모델로 보입니다.

이 모델이 많은 주목을 받는 이유

답은 간단합니다. 보고된 벤치마크 수치가 이례적으로 높기 때문입니다.

오늘 AI 뉴스 사이클에서 보도된 내용에 따르면, Claude Mythos Preview는 다음과 같은 성과를 달성했다고 합니다.

벤치마크	Claude Mythos Preview	Claude Opus 4.6
SWE-Bench Verified	93.9%	80.8%
SWE-Bench Pro	77.8%	53.4%

만약 이 수치들이 정확하다면, 이는 작은 업그레이드가 아닙니다. 이는 엄청난 도약입니다.

SWE-Bench 벤치마크가 중요한 이유는 실제 소프트웨어 엔지니어링 능력을 나타내는 가장 명확한 공개 지표 중 하나이기 때문입니다. 이 벤치마크는 모델이 리포지토리를 읽고, 버그나 문제를 이해하고, 올바른 코드 변경을 수행하며, 현실적인 제약 조건 하에서 작업을 해결할 수 있는지 테스트합니다. 이 정도 규모의 도약은 Anthropic이 코딩 위주의 에이전트 작업에서 이전의 공개된 기술 수준을 훨씬 뛰어넘었음을 시사합니다.

이것이 사람들이 그렇게 강력하게 반응하는 이유입니다. 이야기는 Anthropic이 더 강력한 모델을 가지고 있을 수도 있다는 것만이 아닙니다. 이야기는 Anthropic이 이미 그 모델을 가지고 있으면서도 공개적으로 출시하지 않기로 선택하고 있을 수도 있다는 것입니다.

Anthropic이 Claude Mythos를 비공개로 유지하는 이유

가장 가능성 있는 설명은 이중 용도 위험(dual-use risk)입니다.

방어자들이 취약점을 찾고, 공격 경로를 분석하고, 안전하지 않은 코드를 검토하며, 개선 조치를 자동화하는 데 충분히 강력한 모델은 공격 워크플로를 더 쉽게 만들 수도 있습니다. 블루팀이 시스템을 더 빨리 패치하도록 돕는 동일한 기능이 레드팀이나 악의적인 행위자도 더 빨리 움직이도록 도울 수 있습니다.

모델이 다음을 더 잘 수행할수록 이러한 상충 관계는 더욱 첨예해집니다: - 리포지토리 규모의 코드 이해 - 자율적인 도구 사용 - 취약점 재현 - 장기적인 문제 해결 - 컨텍스트를 잃지 않고 여러 작업을 연결

이것들은 현대 AI 연구소들이 코딩 에이전트에게 바라는 능력들입니다. 또한 사이버 보안 분야에서 우려를 불러일으키는 능력들이기도 합니다.

Anthropic은 선도적인 모델 출시에 더 목표 지향적인 출시 전략이 필요할 수 있다고 한동안 시사해 왔습니다. Claude Mythos Preview는 지금까지 그 전략의 가장 명확한 예시로 보입니다. "광범위하게 출시하고 나중에 패치"하는 대신, 여기서는 "먼저 제한하고, 검증된 사용자로부터 배우고, 그 다음에 무엇을 할지 결정"하는 접근 방식을 취하는 것으로 보입니다.

Project Glasswing이 의미하는 바

Project Glasswing은 Mythos 이야기가 이해되도록 만드는 틀입니다.

보고된 아이디어는 단순히 "더 나은 모델이 여기 있습니다"가 아닙니다. "더 나은 모델이 여기 있지만, 현재는 신뢰할 수 있는 방어 파트너만 사용할 수 있습니다"라는 것입니다. 이는 제품 스토리를 완전히 바꿉니다.

소비자 출시 대신, 이는 보안 미리 보기 프로그램에 더 가깝습니다. 성장이 주요 KPI(핵심 성과 지표)가 되는 대신, 주요 KPI는 통제된 평가일 수 있습니다. 즉, 모델이 방어자에게 무엇을 할 수 있는지, 실제로 어떤 오용 위험이 나타나는지, 그리고 출시 안전 장치가 충분한지를 이해하는 것입니다.

이는 업계에 의미 있는 변화입니다.

연구소들은 지난 2년간 안전에 대해 이야기하면서 대중의 접근을 극대화하려고 노력했습니다. Project Glasswing은 다른 모델을 제시합니다. 가장 유능한 시스템은 먼저 안전 연구자와 기업 파트너가 실제 제약 조건 하에서 테스트하는 제한된, 특정 부문 배포에서 나타날 수 있습니다.

강력한 사이버 역량을 가진 모델에게는 이것이 일반적인 방식이 될 수 있습니다.

Claude Mythos는 Opus 4.6보다 강력한가?

보고된 벤치마크 수치에 따르면 그럴 수 있습니다.

하지만 여기서 정밀함이 중요합니다.

우리가 말할 수 있는 것: - 보고된 수치는 Claude Mythos Preview가 SWE-Bench 스타일 소프트웨어 엔지니어링 작업에서 Opus 4.6보다 상당히 앞서 있음을 시사합니다 - Anthropic은 이 모델을 고위험 모델로 취급하고 있는 것으로 알려졌습니다 - 이 모델은 일반적인 공개 Claude 출시처럼 배포되고 있지 않습니다

아직 확실하게 말할 수 없는 것: - 모든 범주에서 Opus 4.6보다 강력하다는 것 - 공개된 비교 조건이 모든 세부 사항에서 완벽하게 동일했다는 것 - 일반 사용자들이 모든 워크플로우에서 동일한 이득을 볼 것이라는 것

따라서 신중하게 말하자면 다음과 같습니다. Claude Mythos Preview는 최소한 일부 중요한 코딩 벤치마크에서 Claude Opus 4.6보다 실질적으로 강력하며, Anthropic이 위험 때문에 접근을 제한할 정도로 강력한 것으로 보입니다.

이것은 여전히 매우 큰 이야기입니다.

이것이 개발자에게 의미하는 바

대부분의 개발자에게 Claude Mythos는 오늘날 사용할 수 있는 것이 아닙니다. 그러나 다음 코딩 모델의 흐름이 어디로 향하는지 암시하기 때문에 여전히 중요합니다.

세 가지 시사점이 두드러집니다.

1. 공개 Claude 모델은 Anthropic의 최첨단 한계를 반영하지 않을 수 있다

많은 사람들은 최고의 공개 Claude 모델이 연구소의 최고 내부 역량에 가깝다고 가정합니다. Claude Mythos Preview는 그 격차가 많은 사람들이 예상했던 것보다 더 클 수 있음을 시사합니다.

2. 사이버 역량이 주요 출시 병목 현상이 될 수 있다

출시의 가장 큰 제약은 더 이상 모델 품질이 아닐 수 있습니다. 공격적인 오용 위험이 너무 높아지는 임계값을 모델이 넘어서는지 여부일 수 있습니다.

3. 최고의 모델은 제한된 기업 프로그램을 통해 먼저 출시될 수 있다

가장 강력한 시스템을 공개 채팅 앱에서 먼저 보는 대신, 우리는 그것들을 제한된 파트너 네트워크, 산업 파일럿, 그리고 통제된 기업 미리 보기 내부에서 보게 될 수 있습니다.

이는 개발자들이 로드맵을 계획하고, 공급업체를 평가하며, 접근 위험에 대해 생각하는 방식에 영향을 미칠 것입니다.

이것이 AI 산업에 의미하는 바

Claude Mythos Preview는 제품으로서의 중요성보다는 하나의 신호로서 더 중요할 수 있습니다.

만약 Anthropic이 사이버 위험 때문에 모델을 보류할 의향이 있다면, 다른 연구소들도 같은 조치를 취할 수 있습니다. 이는 두 갈래의 AI 시장을 만들 것입니다: - 광범위한 접근성과 더 엄격한 제약을 가진 공개 모델 - 더 강력한 기능과 엄격한 접근 제어를 가진 제한된 모델

이러한 분리는 벤치마크에도 영향을 미칠 것입니다. 연구소는 대중이 본 것보다 훨씬 강력한 시스템을 보유하고 있으면서도, 더 안전하고 약한 버전으로 대중과 경쟁할 수 있습니다. 또한 외부인이 공개 API만으로 진정한 최첨단 기술을 판단하기 더 어렵게 만들 것입니다.

정책적인 관점에서 볼 때, 이는 입법자와 보안 연구자들이 예상해 온 바로 그런 사례입니다. 흥미로운 질문은 강력한 모델이 존재할 것인가가 아닙니다. 그것은 연구소들이 공격적인 오용을 극적으로 쉽게 만들지 않으면서도 방어적 가치를 보존하는 출시 메커니즘을 만들 수 있는지 여부입니다.

Claude Mythos Preview는 연구소가 이러한 문제를 실시간으로 해결하려는 최초의 주목할 만한 사례일 수 있습니다.

개발자들은 지금 당장 관심을 가져야 할까?

네, 하지만 내일 당장 도구를 바꿔야 하기 때문은 아닙니다.

이것이 모델 발표를 읽는 방식을 바꾸기 때문에 관심을 가져야 합니다.

연구소가 공개 모델이 "사용 가능한 최고의" 모델이라고 말할 때, 그것은 더 이상 연구소가 가진 가장 강력한 모델임을 의미하지 않을 수 있습니다. 단지 연구소가 광범위하게 출시할 의향이 있는 가장 강력한 모델임을 의미할 수 있습니다. 이는 다른 진술입니다.

또한 이것이 공급업체 간의 경쟁적 위치에 영향을 미치기 때문에 관심을 가져야 합니다. 만약 Anthropic이 더 강력한 코딩 모델을 보류하고 있다면, 공개 Claude, GPT, Gemini, GLM 및 오픈 가중치 코딩 모델 간의 비교는 비공개 최첨단 시스템이 이미 할 수 있는 것을 과소평가할 수 있습니다.

결론

Claude Mythos Preview는 일반적인 제품 출시가 아닙니다. 이는 소프트웨어 엔지니어링 작업에서 Claude Opus 4.6보다 상당히 강력할 수 있는 제한적인 Anthropic 모델로 보이며, Anthropic이 이를 광범위하게 출시할 의향이 없는 정도로 제한적입니다.

그것만으로도 현재 가장 중요한 AI 이야기 중 하나입니다.

만약 보고된 벤치마크가 정확하다면, 헤드라인은 Anthropic이 더 나은 모델을 만들었다는 것만이 아닙니다. 진짜 헤드라인은 Anthropic이 이미 일부 최첨단 모델이 즉각적인 공개 출시에는 너무 유능하거나, 적어도 너무 위험한 세상에서 운영되고 있을 수 있다는 것입니다.

이는 고급 AI 시스템이 시장에 출시되는 방식에 있어 중대한 변화를 의미할 것입니다.

자주 묻는 질문 (FAQ)

Claude Mythos Preview는 무엇인가요?현재 보도에 따르면, 이는 공개적으로 출시되지 않고 선정된 방어적 사이버 보안 파트너들과 함께 테스트 중인 제한적인 Anthropic 미리 보기 모델입니다.

Claude Mythos는 대중에게 공개되나요?어떤 공개적인 일반 출시도 발표되지 않았습니다. 현재 보도에 따르면 Project Glasswing을 통해 접근이 제한됩니다.

Claude Mythos는 Claude Opus 4.6보다 강력한가요?보고된 벤치마크 수치는 SWE-Bench 스타일 코딩 작업에서 훨씬 강력할 수 있음을 시사하지만, 모든 범주에서 더 강력하다는 것을 증명하지는 않습니다.

Project Glasswing은 무엇인가요?Project Glasswing은 방어적 사이버 보안 환경에서 Claude Mythos Preview를 평가하기 위한 Anthropic의 제한된 접근 프로그램으로 보입니다.

Anthropic은 왜 더 강력한 모델 출시를 거부할까요?가능성이 높은 이유는 이중 용도 위험(dual-use risk) 때문입니다. 방어자들이 코드 및 보안 작업을 자동화하도록 돕는 모델은 공격적인 오용을 더 쉽게 만들 수도 있습니다.

개발자들은 오늘 Claude Mythos를 사용할 수 있나요?광범위하게는 아닙니다. 현재로서는 일반 API 사용자보다는 선정된 파트너 및 연구자에게만 제한되어 있는 것으로 보입니다.