AI가 만든 과제 잡는 ‘GPT 킬러’…날로 먹으려다 ‘딱’ 걸렸다[AI침투보고서]

by김세연 기자
2025.12.05 13:41:10

AI 스타트업 무하유의 ‘GPT킬러’
챗GPT 작성확률 검사…퍼센티지로 가능성 알려
제미나이·클로드·라마 활용 가능성도 분석 가능
한국어에 최적화…향후 프로그래밍 코드까지 탐지

챗GPT, 딥시크 대란에 다들 놀라셨나요? 이처럼 세상을 떠들썩하게 만드는 기술 외에도 우리가 모르는 사이 주변에는 수많은 인공지능(AI) 기술이 침투해 있습니다. 음식도 AI가 만들고 몸 건강도 AI가 측정하는 시대입니다. ‘AI침투보고서’는 예상치 못한 곳에 들어와 있는 AI 스타트업 기술들을 소개합니다.<편집자주>

기사의 이해를 돕기 위한 사진.(사진=챗GPT)


[이데일리 김세연 기자] 과제폭탄을 맞닥뜨린 자들이 모였다. 하지만 모두가 고통스러운 밤을 보내는 건 아니다. 자정이 넘자 서서히 기숙사 불이 꺼지기 시작한다. 누군가는 명령어 몇 줄로 생성한 인공지능(AI)발 과제를 넣고 곧 잠들었다. 누군가는 다음 날 아침이 돼서야 며칠을 고민해 쓴 논문을 제출했다. 제출 마감 시간이 지나자 알 수 없는 속도로 과제를 삼킨 제출함은 흔적 없이 사라진다.

과제들은 교수의 손에 들어갔다. GPT를 사용한 과제와 사용하지 않은 과제. 두 분류의 과제는 겉보기에 큰 차이가 없다. 그렇다고 같은 점수를 줄 수는 없는 법이다. 누군가의 논문에는 ‘AI 생성 가능성 82%’라는 문구가 뜨고 또 다른 논문에는 ‘10%’라는 숫자가 뜬다. 교수는 82%의 가능성을 추적하기 시작한다. 자수하면 F는 주지 않겠다는 경고와 함께 범인을 잡아낸다. 오로지 자신의 능력으로 기막힌 논문을 쓴 학생에게 더 높은 점수를 준다. AI 스타트업 ‘무하유’의 챗GPT 작성확률 검사 솔루션 ‘GPT 킬러’ 덕분이다.

GPT킬러는 챗GPT가 작성한 문장과 사람이 생성한 문장을 각각 학습한 상태다. 문장들의 공통점을 파악해 문장 속 단어와 어순 관계, 맥락, 의미 등을 어떻게 구성하는지 경향성을 도출했다. 그렇게 챗GPT 사용 가능성을 분석할 기반이 마련됐다.

이제 GPT킬러는 과제를 문단 단위로 뜯어본다. 문서 안에 입력된 ‘엔터’를 기준으로 GPT 작성 여부를 검사한다. 한 문단이 400자가 채 안 된다면 다음 문단과 함께 분석 대상에 넣는다.

문단별로 문장 속 단어와 어순 관계, 그로부터 도출되는 맥락을 파악한다. 이전 맥락과의 관계를 고려해 입력된 문단의 챗GPT 사용 가능성을 알아낸다. 가령 챗GPT가 평소 구성하는 문장 흐름이나 딱딱하고 정교한 특징이 묻어난다면 가능성은 커진다. 특정 문체나 패턴만으로 판단하지 않고 딥러닝 기반 모델을 활용해 사람이 인지하기 어려운 텍스트 특성까지 함께 분석한다는 게 GPT킬러의 강점이다.



GPT킬러는 한국어 자연어 이해모델을 기반으로 한다. 덕분에 한국어 문서에 강하다. 특히 논문, 과제물, 자기소개서, 생활기록부 유형의 문서에서 높은 정확도를 보이도록 최적화돼 있다.

GPT킬러는 이름처럼 챗GPT 사용 가능성만 분석하는 건 아니다. 구글 ‘제미나이’, 앤드로픽 ‘클로드’, 메타 ‘라마’ 등 다양한 거대언어모델(LLM)이 생성한 텍스트와 실제 사람이 작성한 텍스트를 함께 활용해 학습했다. 즉, 다른 LLM 사용 가능성도 분석할 수 있다는 얘기다.

LLM 사용 가능성은 퍼센티지로 제공된다. 적어도 가능성이 50% 이상으로 나온다면 유의해서 검토해야 한다.

시대에 퇴보할 걱정은 접어둬도 된다. 챗GPT를 ‘활용’하는 건 문제가 되지 않는다. AI가 쓴 글을 기반으로 다시 나의 글을 만들면 GPT 사용 가능성은 현저히 떨어진다.

GPT킬러는 향후 수식이 많은 실험보고서나 프로그래밍 코드도 탐지할 수 있도록 진화할 예정이다.

사람과 AI의 글이 점점 비슷해지는 시대다. GPT킬러는 그 희미해진 경계선을 다시 한번 또렷하게 그려 넣고 있다.