“챗GPT로 쓴 논문, '팩트체크' 해드립니다”

김현아 기자I 2023.03.26 17:14:29

국내 1위 논문 표절 검사 '카피킬러'만든 무하유
신동호 대표 인터뷰, 연내 서비스 출시 예정
"촘스키 언어학 배웠는데 챗GPT는 충격"
세상의 지식 데이터 모아 유효성 검사
"정부나 연구소 등의 웹문서 출처 비교 등"

[이데일리 김현아 기자]
신동호 무하유 대표. 사진=무하유
신동호 무하유 대표. 사진=무하유


“(인공지능 챗봇인)챗GPT로 작성된 논문 내용을 팩트체크 하듯이 유효성을 평가해 주는 서비스를 개발 중입니다. 연내 출시가 목표죠.”

국내 1위 논문 표절 검증 서비스 ‘카피킬러’를 개발한 무하유의 신동호 대표는 지난 21일 이데일리와의 인터뷰에서 챗GPT로 쓴 논문이 얼마나 신뢰성이 있는지 평가하는 일에 도전하고 있다고 밝혔다.

‘카피킬러’가 인용 누락 등 표절을 수치로 보여준다면, 새 서비스는 챗GPT가 쓴 문장이 참인지 아닌지 보는 것이다. 연구소나 정부기관 등 신뢰할만한 기관의 웹 문서에 있는지 출처를 대조해 평가하는 방식을 취한다. AI 기술기업 코난테크놀로지 출신인 신 대표는 2012년 ‘카피킬러’를 개발해 국내 표절검사 시장에서 외산인 ‘턴잇인(Turnitin)’을 물리쳤고, 일본에 이어 연내 중국 표절검사 시장에도 진출한다.

인간의 언어 구현하는 챗GPT…촘스키 틀렸나

평생을 인공지능(AI) 자연어처리에 관심을 뒀던 신 대표지만, GPT-4와 챗GPT는 충격이었다고 한다. 그는 “촘스키의 언어학이나 인지 심리학을 공부한 입장에선 신경회로망 학습으로 인간의 언어 능력을 구현하는 건 안될줄 알았다. 그런데 신념이 깨졌다. 챗GPT와싸우는 건 아닌 것 같다”고 평했다.

이런 이유로 학교에선 학생들의 챗GPT 사용을 막거나 적발 시 0점으로 처리하기도 한다. 하지만, 신 대표는 수학 문제를 풀 때 계산기를 허용하듯이, 챗GPT같은 생성형 AI를 금지하는 건 어려울 것으로 봤다.

그렇다면, 논문 하나에 저자가 직접 쓴 부분, 타인의 논문을 인용한 부분, 챗GPT를 이용한 부분이 혼재할 텐데, 이를 구분할 수 있을까.

또, 교수님들은 챗GPT의 그럴싸한 거짓말을 알아챌 수 있을까. 챗GPT는 수많은 데이터를 기반으로 문장을 만드는 탓에 사실이 아닌, 없는 이야기를 지어내기도 한다.

그는 “연구윤리 차원에서 챗GPT를 이용한 부분은 앞으로 ‘powered by 챗GPT’ 같은 걸로 표시하는 게 의무화되지 않을까”라면서 “앞으론 챗GPT가 적은 문장이 내용상 유효한지 검사하는 게 중요해질 것”이라고 예상했다.

세상의 지식 데이터 모아 챗GPT 유효성 검사

하지만, 역사상 최고로 똑똑한 기계가 만든 언어의 유효성을 또 다른 기계로 평가하는 게 가능할까.

그는 “시골 할머니들을 뵈면 세상에 대한 지식은 별로 없지만 말씀은 구수하게 잘하시는 언어적 능력가들이 계신다”면서 “인간의 언어 능력은 언어적 능력과 세상에 대한 지식으로 나뉘는데, 우리는 후자인 지식 쪽에 희망을 걸고 그쪽을 공략하는 방향으로 가려는 것”이라고 했다.

무하유가 자신감을 보이는 것은 패턴을 분석해 표절을 검사했던 경험에다, AI 채용 평가 ‘프리즘’, AI 면접 ‘몬스터’를 서비스하면서 인간의 서류 검토를 자동화하는 일에 노하우를 쌓았기 때문이다.

신 대표는 “카피킬러가 표절률을 보여주는 기계적 검사였다면, 자기소개서를 평가해 주는 프리즘이나 자소서를 보고 AI가 면접 질문을 생성해주는 몬스터에는 평가라는 개념이 들어가 있다”면서 “AI 채용 서비스들이 3만 명 자소서를 보고 1등부터 3만 등까지 줄 세워야 했던 인사부서의 업무를 줄여줬듯이, 챗GPT로 적은 논문의 유효성을 평가해주는 서비스는 교수님들의 업무를 도울 수 있을 것”이라고 자신했다.



무하유라는 사명은 장자의 ‘무하유지향(無何有之鄕·세속적인 번거로움이 없는 자연 그대로의 곳, 유토피아)’에서 따왔다. 첨단 AI 기업 이미지와는 어울리지 않는(?)이름이다. 신동호 대표는 “동양철학, 노장사상에 관심이 많아 사명을 그리 지었다. 별 의미는 없다”고 했지만, 무하유의 비전을 보면 어울린다는 생각도 든다.

GPT-4 다음 버전에선 ‘도표(다이어그램)’ 답변도 가능해진다는데, 이런 생성형 AI를 평가하는 일에는 정확함과 함께, 창조의 영역에 대한 겸손이 필요할지도 모르기 때문이다.

인간의 읽기를 대신해 주는 회사가 비전

그는 “평가 모델을 만들 때는 먼저 각 도메인의 전문가들로부터 지식을 배우고 이를 기능화해서 딥러닝해서 평가표를 만든다”면서 “갈 길이 멀다. 하지만, 무하유는 정답 문서를 찾아주는 검색 이후의 디지털 세상, 즉 ‘인간의 읽기를 대신해 주는 회사’를 지향한다”며 웃었다.

무하유는 총 19건의 특허를 갖고 있다. 논문 표절 검사 서비스인 ‘카피킬러’에 적용된 ‘문서 표절률 산출 장치 및 방법, 이를 구현하기 위한 프로그램을 기록한 기록매체’와 ‘프리즘’, ‘몬스터’ 등 AI 채용 서비스에 쓰인 ‘자기소개서를 기반으로 면접 질문을 생성하는 서버 및 방법’이 대표적인 특허다.

주요 뉴스

ⓒ종합 경제정보 미디어 이데일리 - 상업적 무단전재 & 재배포 금지