AI, 자율적 사이버 공격의 문을 열다: 클로드 미토스(Claude Mythos)의 충격적 등장
인공지능(AI) 기술의 발전 속도는 경이롭습니다. 불과 몇 년 전만 해도 상상하기 어려웠던 일들이 현실이 되고 있으며, 특히 사이버 보안 분야에서의 AI 역량은 이제 우려를 넘어선 경고등을 울리고 있습니다. 최근 영국의 AI 안전 연구소(AISI, AI Safety Institute)가 발표한 연구 결과는 이러한 우려를 극명하게 보여줍니다. 앤트로픽(Anthropic)의 최신 AI 모델인 클로드 미토스 프리뷰(Claude Mythos Preview)가 사상 최초로 기업 네트워크에 대한 완전한 자율적 공격 시뮬레이션을 성공적으로 수행했기 때문입니다. 참고기사에 따르면, 이 모델은 방어가 취약한 소규모 네트워크를 대상으로 초기 정찰부터 최종 시스템 장악까지, 사람의 개입 없이 스스로 모든 단계를 완수했습니다.
AISI는 클로드 미토스 프리뷰가 AI 사이버 역량에 있어 ‘상당한 도약(significant leap)’을 의미한다고 평가했습니다. 불과 2년 전만 해도 최신 AI 모델들은 초보적인 수준의 사이버 작업조차 제대로 처리하기 어려웠습니다. 하지만 이제 AI는 인간 보안 전문가들이 며칠이 걸릴 수도 있는 다단계 공격을 자율적으로 실행하며, 취약점을 식별하고 악용하는 수준에 도달했습니다. 이는 단순히 기술적인 진보를 넘어, 전 세계 기업과 정부, 개인의 디지털 자산 보호 방식에 근본적인 변화를 요구하는 중대한 전환점이라 할 수 있습니다. AI가 사이버 공격의 주체가 될 수 있다는 사실은 이제 더 이상 공상과학 소설 속 이야기가 아닌, 우리가 직면해야 할 현실이 된 것입니다. 이러한 AI의 양면성은 전 세계적인 AI 거버넌스 및 안전성 논의에 더욱 불을 지피고 있습니다.
인간 전문가의 20시간 작업을 단숨에, 클로드 미토스의 놀라운 해킹 능력
AISI의 평가는 구체적인 실험 결과에 기반하고 있습니다. 연구진은 클로드 미토스 프리뷰의 사이버 역량을 평가하기 위해 두 가지 주요 방법을 사용했습니다. 첫 번째는 ‘Capture-The-Flag (CTF)’ 챌린지로, AI 모델이 목표 시스템의 취약점을 찾아내고 악용하여 숨겨진 ‘깃발’을 확보하는 방식입니다. AISI에 따르면, 미토스 프리뷰는 견습생(apprentice) 수준 작업에서 약 85%, 초보 기술 비전문가(beginner-level technical non-expert) 작업에서 약 95%의 성공률을 기록했습니다(250만 토큰 예산 기준). 이는 GPT-5.4, Codex 5.3, Claude Opus 4.6과 함께 최고 수준의 AI 모델 그룹에 속하는 성과입니다.
특히 주목할 점은 더 큰 컴퓨팅 예산(5천만 토큰)을 투입했을 때의 결과입니다. 미토스 프리뷰는 실무자(practitioner) 수준 작업에서 약 93%, 전문가(expert-level) 수준 챌린지에서 약 73%라는 놀라운 점수를 달성했습니다. AISI는 2025년 4월 이전에는 어떤 모델도 전문가 수준 작업을 해결할 수 없었다는 점을 강조하며, 이번 성과가 AI 사이버 역량의 비약적인 발전을 의미한다고 설명했습니다. 이러한 수치들은 AI가 단순히 단순 반복 작업을 넘어, 복잡한 문제 해결 능력까지 갖추게 되었음을 시사합니다.
CTF 챌린지는 개별 기술을 평가하는 데 유용하지만, 실제 사이버 공격은 수십 개의 단계를 여러 호스트 및 네트워크 세그먼트에 걸쳐 연결해야 하는 복잡한 작업입니다. 이러한 복잡성을 측정하기 위해 AISI는 ‘The Last Ones (TLO)’라는 시뮬레이션을 개발했습니다. TLO는 초기 정찰부터 전체 네트워크 장악에 이르는 32단계 공격 시나리오로, 인간 전문가가 완료하는 데 약 20시간이 소요될 것으로 추정됩니다. 클로드 미토스 프리뷰는 이 TLO 시뮬레이션을 처음으로 처음부터 끝까지(end-to-end) 완료한 모델이 되었습니다. 10번의 시도 중 3번의 시도에서 완전한 네트워크 장악에 성공했으며, 평균적으로 32단계 중 22단계를 완료했습니다. 다음으로 우수한 모델인 클로드 오푸스 4.6이 평균 16단계를 완료한 것과 비교하면 미토스 프리뷰의 성능은 압도적입니다. AISI는 더 많은 추론 컴퓨팅 자원(1억 토큰 예산 사용)이 투입될수록 성능이 계속 향상될 것으로 예상하며, 이는 AI의 사이버 공격 능력이 컴퓨팅 파워에 비례하여 더욱 강화될 수 있음을 시사합니다.
AI 사이버 역량의 양면성: 기회와 위협, 그리고 산업의 대응 과제
클로드 미토스 프리뷰는 놀라운 능력을 보여주었지만, 동시에 명확한 한계점도 드러냈습니다. AISI가 산업 제어 기술(OT, Operational Technology)을 대상으로 한 별도의 공격 시뮬레이션에서는 모델이 공격을 완료하는 데 실패했습니다. 하지만 이는 모델이 OT 구성 요소 자체를 공격하지 못했다기보다는, 시뮬레이션의 초기 단계인 IT 네트워크에서 진행이 멈췄기 때문으로 분석됩니다. 즉, OT 시스템에 도달하기도 전에 IT 네트워크의 복잡성에 막혔다는 의미입니다.
AISI는 이번 테스트 결과에 대한 몇 가지 주의사항도 명확히 밝혔습니다. 테스트 환경에는 능동적인 방어자, 보안 도구, 그리고 실제 네트워크에서 경보를 울릴 수 있는 행동에 대한 결과가 없었습니다. 따라서 이번 결과만으로는 미토스 프리뷰가 ‘잘 방어된(well-defended)’ 시스템을 성공적으로 침해할 수 있는지 여부를 판단할 수는 없습니다. 그럼에도 불구하고 AISI는 이 모델이 ‘네트워크에 접근 권한이 확보된 작고 방어가 취약한 취약한 기업 시스템을 자율적으로 공격할 수 있다’는 점은 확실하다고 강조했습니다. 이는 기업들이 기본적인 보안 수칙을 철저히 지키는 것이 얼마나 중요한지를 다시 한번 일깨워줍니다.
💡 추가 정보
참고 기사에서는 AISI가 이러한 AI 모델의 발전과 함께 사이버 보안의 중요성을 더욱 강조하고 있다고 설명합니다. AISI는 향후 능동적인 모니터링, 엔드포인트 탐지, 실시간 사고 대응이 가능한 ‘강화된 환경(hardened environments)’에서 추가 평가를 수행할 계획이라고 밝혔습니다. 특히, 정기적인 패치 적용, 강력한 접근 제어, 안전한 구성, 철저한 로깅 등 사이버 보안의 기본 원칙을 준수하는 것이 중요하다고 강조했습니다. 또한, AI 사이버 역량은 ‘이중 용도(dual-use)’의 성격을 지니고 있음을 지적하며, 보안 위험을 초래하는 동시에 사이버 방어를 크게 강화할 수도 있다고 언급했습니다. 영국 국립 사이버 보안 센터(NCSC)와의 공동 블로그 게시물에서 AISI는 방어자들이 최첨단 AI에 어떻게 대비하고 이를 활용할 수 있는지에 대한 지침을 제시하기도 했습니다. AISI는 2023년부터 AI 사이버 역량을 추적해왔으며, 채팅 기반 쿼리부터 CTF 챌린지, 그리고 복잡한 다단계 공격 시뮬레이션에 이르기까지 평가 기준을 꾸준히 높여왔습니다. 한편, 앤트로픽은 4월 초에 클로드 미토스를 공식 출시했지만, 사이버 보안 우려로 인해 현재 약 50개 회사에만 제한적으로 제공하고 있습니다. 이는 2019년 OpenAI가 GPT-2의 위험성을 이유로 출시를 주저했던 상황과 유사합니다. 일부 비평가들은 이러한 제한이 과장되었거나, 앤트로픽이 모델을 더 광범위하게 제공할 컴퓨팅 용량이 부족하기 때문일 수 있다고 주장하지만, 이는 아직 추측에 불과합니다.
이번 클로드 미토스 프리뷰의 등장은 AI 안전성 논의의 중요성을 더욱 부각시킵니다. AI가 가진 강력한 능력은 분명 인류에게 엄청난 잠재적 이점을 제공하지만, 동시에 통제되지 않을 경우 예측 불가능한 위험을 초래할 수 있습니다. 특히, 사이버 공격과 같은 민감한 영역에서의 자율성 증가는 기술 개발자와 기업, 정부 모두에게 막중한 책임을 부여합니다. AI의 양면성을 이해하고, 이를 인류의 이익을 위해 활용하는 동시에 잠재적 위협을 최소화하기 위한 다각적인 노력이 시급한 시점입니다.
자율 AI 해킹 시대, 우리가 준비해야 할 것들
클로드 미토스 프리뷰의 등장은 AI가 취약한 기업 네트워크를 자율적으로 공격할 수 있는 수준에 도달했음을 명확히 보여줍니다. 이는 단순한 기술적 진보를 넘어, 사이버 보안의 패러다임을 근본적으로 변화시킬 중대한 사건입니다. 이제 우리는 AI가 제공하는 방대한 기회와 함께, AI가 야기할 수 있는 전례 없는 위협에 대한 현실적인 인식을 바탕으로 미래를 준비해야 합니다.
이러한 변화는 다양한 이해관계자들에게 중요한 시사점을 던집니다. AI 산업계와 개발자들은 모델의 성능 향상만큼이나 안전성 확보에 최우선 순위를 두어야 합니다. ‘책임감 있는 AI 개발’이라는 원칙 아래, 잠재적 악용 가능성에 대한 철저한 레드 팀(Red Teaming) 테스트와 안전 프로토콜 구축이 필수적입니다. 기업들은 AI 기반 공격의 위협에 대비하여 사이버 보안 투자를 대폭 확대하고, 기존의 방어 체계를 재점검해야 합니다. 기본적인 보안 수칙 준수는 물론, AI 기반 위협 탐지 및 대응 시스템 도입을 적극적으로 고려해야 할 것입니다. 정부와 규제 당국은 AI의 사이버 역량 발전에 발맞춰 관련 법규 및 정책을 신속하게 정비하고, 국제적인 협력을 통해 AI 안전 및 사이버 전쟁에 대한 공동 대응 방안을 모색해야 합니다.
결론적으로, 클로드 미토스 프리뷰의 사례는 AI 기술이 가진 양날의 검과 같은 특성을 극명하게 보여줍니다. AI는 사이버 방어의 강력한 도구가 될 수 있지만, 동시에 가장 강력한 공격 도구가 될 수도 있습니다. 이 기술 발전이 제기하는 주요 질문은 명확합니다: 우리는 AI의 사이버 공격 능력이 방어 능력을 앞지르지 않도록 어떻게 균형을 맞출 것인가? AI의 잠재적 위험을 최소화하면서도 그 혜택을 극대화하기 위한 사회적 합의와 기술적 노력이 절실한 시점입니다. 앞으로 AI 기술의 발전 방향과 업계의 대응 방안은 우리 사회의 디지털 미래를 결정짓는 중요한 요소가 될 것입니다.
참고
Matthias Bastian, Claude Mythos can autonomously compromise weakly defended enterprise networks end-to-end
AI FOCUS에서 더 알아보기
구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.