MS는 최근 코파일럿 내 심층 연구 에이전트 ‘리서처’를 업데이트하고 서로 다른 AI 모델이 역할을 나눠 작업하는 ‘멀티모델’ 방식을 적용했다고 밝혔다. 기존처럼 하나의 모델이 답변 생성부터 검증까지 수행하는 구조에서 벗어나 생성과 평가를 분리한 것이 특징이다.
|
여러 모델 답변을 동시에 비교할 수 있는 ‘모델 카운슬’ 기능도 함께 도입됐다. 사용자는 동일한 질문에 대해 각기 다른 모델이 생성한 결과를 한 화면에서 확인하고 최적의 답을 선택할 수 있다.
이번 업데이트는 ‘프론티어(Frontier) 프로그램’을 통해 일부 기업 고객에게 우선 제공된다. MS는 이를 통해 장시간·다단계 업무를 수행하는 ‘코파일럿 코워크(Copilot Cowork)’ 환경을 구현한다는 계획이다.
성능 개선도 수치로 확인됐다. 크리틱 기능이 적용된 리서처는 심층 연구 평가 지표인 드라코(DRACO) 벤치마크에서 기존 단일 모델 기반 시스템을 크게 앞섰다. 총 10개 분야 100개 과제를 평가한 결과, 종합 점수가 약 7포인트 상승했으며 기존 최고 성능 모델 대비 13% 이상 높은 수준을 기록했다.
업계에서는 이번 시도를 기업용 AI가 ‘단일 모델 경쟁’에서 ‘멀티모델 협업’으로 전환하는 신호로 보고 있다. 개별 모델의 성능 개선에 의존하던 방식에서 벗어나, 서로 다른 AI의 강점을 결합해 결과 품질을 끌어올리는 구조가 확산될 수 있다는 분석이다.
특히 MS가 자체 모델 개발과 함께 외부 AI를 적극 통합하는 전략을 택하면서 향후 기업용 AI 시장에서도 플랫폼 경쟁이 한층 치열해질 것으로 전망된다.





