X

앤스로픽, 안전 장치 도입한 '미토스급' AI 일반 공개

이 기사 AI가 핵심만 딱!
애니메이션 이미지
김겨레 기자I 2026.06.10 06:44:54

''미토스5'' 및 안전장치 적용 ''페이블5'' 공개
해킹·무기 등 위험 질문엔 하위 모델이 답변
''미토스 미리보기''보다 벤치마크 성능 향상
몸값 1460조 IPO 앞두고 수익성 극대화

[이데일리 김겨레 기자] 앤스로픽이 기업공개(IPO)를 앞두고 ‘미토스’ 수준의 최상위 인공지능(AI) 모델에 사이버보안 안전장치를 도입해 일반에 공개했다.
앤스로픽. (사진=AFP)
월스트리트저널(WSJ) 등 외신에 따르면 앤스로픽은 미토스급 모델을 일반용으로 안전하게 다듬은 AI 모델 ‘클로드 페이블5’와 ‘클로드 미토스5’를 출시한다고 9일(현지시간) 밝혔다.

페이블5와 미토스5는 사실상 같은 모델이지만, 페이블5는 악용 위험이 큰 분야에 안전 장치를 적용했다. 페이블5는 악의적 해커의 악용이 우려되는 사이버 보안 분야나 생화학 무기 등의 대한 질의(프롬프트)를 받으면 안전한 답변을 위해 아래단계 모델인 ‘오퍼스4.8’이 대신 처리하도록 했다. 경쟁 AI 모델의 기능을 추출하는 이른바 무단 ‘증류’로 의심되는 질의에도 적용된다.

사용자가 페이블5를 속여 앤스로픽의 안전 장치를 우회해 답변을 얻는 ‘탈옥’을 시도할 수도 있지만, 앤스로픽은 탈옥이 불가능하도록 광범위한 테스트를 했다고 밝혔다.

앤스로픽은 “모델을 안전하고 신속하게 출시하기 위해 이러한 안전장치를 보수적으로 적용했다”며 “이 때문에 무해한 요청이 차단되는 경우도 있지만, 평균적으로 전체의 5% 미만에서만 발동된다”고 설명했다.

일부 영역에서 안전장치가 해제된 미토스5는 미 행정부와 협력 하에 보안 협의체 ‘프로젝트 글래스윙’을 통해 검증된 200여곳의 기관에만 선별적으로 제공된다. 한국에서는 삼성전자(005930)와 SK하이닉스(000660), SK텔레콤(017670), 한국인터넷진흥원(KISA) 등이 프로젝트 글래스윙에 참여한다.

앤스로픽에 따르면 이번 새 모델은 두 달 전 공개했던 ‘미토스 미리보기’보다도 더 뛰어난 성능지표(벤치마크)를 기록했다. 특히 문서 기반 추론, 차트 및 표 해석, 문제 해결 능력에서 상당한 능력이 향상됐다.

앤스로픽이 미토스 수준의 페이블5를 일반에 공개한 것은 IPO를 앞두고 9560억달러(1460조원)에 달하는 기업가치를 증명하기 위한 의도로 풀이된다. 페이블5는 입력 토큰 백만 개당 10달러, 출력 토큰 백만 개당 50달러의 비용이 드는데, 이는 클로드 오푸스 4.8보다 두 배나 비싸 수익성을 높일 수 있다는 분석이다.

다이앤 펜 앤스로픽 연구부문 제품 관리 책임자는 CNBC와 인터뷰에서 “이 기술을 가치 있는 방식으로 제공하는 동시에, 해악보다는 더 많은 이익을 창출할 수 있도록 안전장치를 마련하는 것이 중요하다”고 말했다.

이 기사 AI가 핵심만 딱!
애니메이션 이미지

주요 뉴스

ⓒ종합 경제정보 미디어 이데일리 - 상업적 무단전재 & 재배포 금지