미국 정부는 외국인이 Fable 5를 사용하는 것을 금지했으며, Anthropic은 이에 대해 반박하는 글을 발표했다
저자:熊磊
편집:서청양
미국 현지 시간 6월 12일, AI 규제 역사상 드문 정부와 기업 간의 정면 대결이 금요일 갑자기 촉발되었다.
미국 정부는 국가 안보를 이유로 Anthropic에 수출 통제 지시를 내리고, 즉시 모든 외국 주체의 Fable 5와 Mythos 5 두 AI 모델에 대한 접근 권한을 중단할 것을 요구했다. 이 지시는 범위가 매우 넓어 미국 외부의 외국 사용자뿐만 아니라 미국 내에 있는 외국 시민, 심지어 Anthropic 회사 내부의 외국 직원에게도 적용된다.
규정 준수 조치로 Anthropic은 모든 사용자에게 이 두 모델의 접근을 전면 차단해야 했다------이는 현재 규정을 준수할 수 있는 유일한 실행 가능한 방안으로, 회사는 기술적으로 "외국 주체"와 "미국 시민" 사용자 집단을 정확히 구분할 수 없기 때문이다. 회사의 다른 모델에 대한 접근은 영향을 받지 않으며, 사용자는 자동으로 Claude Opus 4.8로 되돌아간다.
이 긴급 중단은 갑작스럽게 발생했다. Fable 5와 Mythos 5는 6월 9일 공식 출시되었으며, 지금까지 단 3일이 지났다. 두 모델의 갑작스러운 하차는 기술계와 AI 커뮤니티에서 광범위한 충격을 일으켰다.
01 두 모델은 도대체 무엇인가
이 사태의 핵심 긴장을 이해하려면 Fable 5와 Mythos 5가 어떤 모델인지, 그리고 왜 처음부터 규제의 조명 아래에 있었는지를 알아야 한다.
Mythos는 Anthropic이 Opus 시리즈보다 능력 수준이 높은 새로운 모델 가족으로, 현재 Anthropic이 공개 배포할 수 있는 최고 능력 수준을 대표한다. 첫 번째 Mythos 모델인 Claude Mythos Preview는 올해 4월 "Project Glasswing" 프로젝트를 통해 출시되었으며, 접근 권한은 소수의 협력 파트너로 엄격히 제한되었다. 그 이유는 이 모델이 사이버 보안 분야에서의 능력이 너무 강력하여 광범위하게 개방하기에 적합하지 않기 때문이다.
Fable 5는 대중에게 공식적으로 개방된 첫 번째 Mythos급 모델로, 능력이 Anthropic이 이전에 발표한 모든 사용 가능한 모델을 초과하며, 소프트웨어 공학, 지식 작업, 시각적 이해, 과학 연구 등 거의 모든 테스트 기준에서 업계 최고 수준에 도달했다.
공식 출시를 위해 Anthropic은 Fable 5에 전용 보안 방어 메커니즘을 장착했다------사이버 보안, 생물학, 화학 등 고위험 분야에서 모델은 자동으로 응답을 차단하고 Claude Opus 4.8로 되돌아간다.
Mythos 5는 동일한 기본 모델을 기반으로 하여 보안 방어가 적은 버전으로, 이전에 Project Glasswing 접근 권한을 얻은 승인 기관에만 개방되며, 사이버 보안 방어자와 핵심 인프라 운영자를 위한 전문 도구로定位된다. 두 모델의 가격은 동일하며, 입력 토큰 100만 개당 10달러, 출력 토큰 100만 개당 50달러이다.
02 지시를 촉발한 단서
보도에 따르면, 미국 상무부 장관 하워드 루트닉(Howard Lutnick)은 6월 12일 Anthropic CEO 다리오 아모데이(Dario Amodei)에게 서신을 보내 Mythos 5와 Fable 5가 수출 통제를 받을 것이라고 발표했다. 이 결정을 촉발한 직접적인 이유는 다른 회사가 Mythos에 대해 "탈옥"을 할 수 있다고 주장하여 트럼프 정부가 잠재적인 국가 안보 위험에 경각심을 가지게 된 것이다.
전해진 바에 따르면, 트럼프 정부는 이전에 Anthropic이 이 두 모델을 출시하는 것을 막으려 했으나 성공하지 못했다------이로 인해 정부는 이후 수출 통제라는 더 강력한 수단을 취하게 되었다.
갑작스러운 이 지시에 직면한 Anthropic은 규정 준수를 실행하는 동시에 정부의 이유에 대해 체계적인 반박을 담은 드문 강경한 성명을 발표했다.
Anthropic은 정부가 보유한 "탈옥" 증거가 매우 좁은 범위의 공격 방식에만 해당하며, 본질적으로 모델이 특정 코드 라이브러리를 읽고 그 안의 소프트웨어 취약점을 수정하도록 요구하는 것이라고 주장했다------이러한 능력은 OpenAI GPT-5.5를 포함한 다른 공개 사용 가능한 모델에서도 존재하며, 매일 사이버 보안 방어자들이 정상적인 시스템 유지 관리 작업에 사용하고 있다.
Anthropic은 성명에서 "제한된 범위의 잠재적 탈옥"이 배포된 상업 모델을 회수하는 기준이 된다면, 사실상 전체 산업의 모든 최전선 모델의 새로운 배포가 전면 중단될 것이라고 명확히 밝혔다. 회사는 또한 정부의 이번 조치가 이전에 공개적으로 요청한 투명하고 공정하며 기술적 사실에 기반한 법적 절차를 따르지 않았다고 강조했다.
Anthropic은 정부의 합법적인 지시를 준수할 것이며, 정부와의 소통을 적극적으로 노력하여 가능한 한 빨리 접근 권한을 복구하고, 향후 24시간 내에 더 많은 기술 세부 정보를 발표할 것이라고 밝혔다. 회사는 이번 사건이 오해에서 비롯된 것이라고 생각하며, 사용자에게 불편을 끼친 점에 대해 깊이 사과했다.
다음은 Anthropic이 발표한 "미국 정부의 Fable 5 및 Mythos 5 접근 권한 중단 지시"에 대한 성명 전문이다:
미국 정부는 국가 안보 권한에 따라 수출 통제 지시를 발표하고, 모든 외국 시민이 Fable 5와 Mythos 5에 접근하는 권한을 중단할 것을 요구한다. 이는 그들이 미국 내에 있든 외부에 있든, Anthropic의 외국 직원도 포함된다. 이 지시의 실제 효과는 우리가 즉시 모든 사용자에게 Fable 5와 Mythos 5의 접근을 차단해야 한다는 것이다. 다른 Anthropic 모델은 영향을 받지 않는다.
우리는 오늘 미 동부 시간 오후 5시 21분에 이 지시를 받았다. 서신에는 구체적인 국가 안보 우려 사항이 명시되어 있지 않았다. 우리가 이해한 바에 따르면, 정부는 Fable 5의 보안 방어를 우회하는 방법, 즉 소위 "탈옥" 기술을 알고 있다고 생각하고 있다. 우리는 이 기술의 시연을 검토했으며, 그 기술이 이전에 알려진 소수의 취약점만을 인식할 수 있다는 것을 발견했다. 이러한 취약점은 모두 간단하며, 다른 공개 사용 가능한 모델은 탈옥 없이도 동일한 문제를 발견할 수 있다.
Anthropic은 Fable 출시 블로그 기사에서 우리의 보안 방어에 대한 입장을 다음과 같이 설명했다:
우리는 강력한 보안 방어 메커니즘을 구축하여 Fable이 사이버 보안 등 관련 작업에 악용될 가능성을 크게 줄였다. 사실, 일부 사용자는 우리의 방어 조치가 지나치게 엄격하다고 보고하고 있다.
Fable 출시 몇 주 전, Anthropic은 미국 정부, 영국 AI 보안 연구소, 여러 제3자 기관 및 내부 팀과 협력하여 Fable의 보안 방어를 위해 수천 시간의 레드 팀 테스트를 수행했다. 테스트 결과는 Fable의 보안 방어 효과가 이전에 배포된 모델보다 현저히 우수하다는 것을 보여주었다.
현재까지 테스트 담당자는 "범용 탈옥" 방법을 찾을 수 없었다------즉, 모델의 보안 방어를 전면적으로 돌파하고 광범위한 네트워크 공격 능력을 잠금 해제할 수 있는 탈옥 방법이다.
우리는 현재 어떤 모델 제공업체도 완벽한 탈옥 방어를 구현할 수 없다고 생각한다. 업계의 모든 방어 메커니즘은 "비범용 탈옥"에 의해 돌파될 가능성이 있으며(즉, 특정 상황에서 일부 네트워크 정보를 얻는 것), 미래에는 범용 탈옥 방법이 나타날 수도 있다. 이 점은 우리가 Fable 5 출시 시 명확히 설명했다.
완벽한 탈옥 방어가 현재로서는 불가능하므로, Anthropic은 Fable 5에 대해 심층 방어 전략을 채택했다. 우리의 목표는 탈옥 공격이 매우 좁은 범위(비범용 탈옥에 대한)거나 비용이 매우 높(범용 탈옥에 대한)도록 하여, 모든 성공적인 공격 행동을 신속하게 발견하고 억제할 수 있도록 전면 모니터링을 보완하는 것이다. 이것이 Anthropic이 고객 데이터 보존을 30일로 요구하는 이유이기도 하다------비록 이 정책이 우리의 고객 관계에 실제 영향을 미쳤지만, 이는 우리가 탈옥 위험을 연구하고 대응하는 데 도움이 된다.
우리는 이 심층 방어 전략을 고수하고 있다. 이는 Fable이 초래하는 위험을 효과적으로 줄여, 업계에 이미 배포된 모델의 위험 수준과 동등하게 만든다.
현재까지 우리는 비범용 탈옥으로 인해 유해한 결과를 초래할 수 있는 공식적인 보고를 받은 적이 없다. 우리에게 보고된 잠재적 탈옥 사례는 모두 완전히 무해하거나 Mythos의 고유 능력을 나타내지 않는 경미한 발견에 해당한다.
현재 미국 정부는 우리에게 구두 증거만을 제공했으며, 이는 잠재적이고 제한된 범위의 비범용 탈옥 방식에 관한 것으로, 본질적으로 모델이 특정 코드 라이브러리를 읽고 그 안의 소프트웨어 취약점을 수정하도록 요구하는 것이다. 우리가 이해한 바에 따르면, 이 잠재적 탈옥 방식은 정부와 공유되었다. 우리는 한 보고서를 검토했으며------우리는 이 보고서가 정부가 이 지시를 발표하는 근거가 되었다고 생각하며------보고서에서 보여준 능력 수준이 다른 모델에서도 일반적으로 존재하며(OpenAI의 GPT-5.5 포함), 매일 사이버 보안 방어자들이 시스템 보안을 유지하는 데 사용되고 있다는 것을 확인했다. 우리는 향후 24시간 내에 더 많은 세부 정보를 발표할 것이다.
우리는 정부의 합법적인 지시에 따라 모든 사용자에게 Fable 5와 Mythos 5의 접근 권한을 차단할 것이다. 그러나 우리는 제한된 범위의 잠재적 탈옥 방식을 발견하는 것만으로 수억 명의 사용자에게 배포된 상업 모델을 회수할 수 있는 이유가 된다고 동의하지 않는다. 이러한 기준이 전체 산업에 적용된다면, 사실상 모든 최전선 모델 제공업체의 새로운 모델 배포가 전면 중단될 것이다.
우리는 정부가 투명하고 공정하며 명확하고 기술적 사실에 기반한 법적 절차에 따라 불안전한 모델 배포를 막을 권리가 있다고 공개적으로 밝혀왔다. 이번 조치는 이러한 원칙을 따르지 않았다.
사용자에게 불편을 끼친 점에 대해 깊이 사과드린다. 우리는 이번 사건이 오해에서 비롯된 것이라고 생각하며, 접근 권한을 가능한 한 빨리 복구하기 위해 적극적으로 노력하고 있다.












