챗GPT 휴먼피드백의 비밀…韓 IT기업들 비상

by김현아 기자
2023.04.02 16:27:25

오픈AI, 외주인력 고용해 인간이 랭킹 매겨 윤리문제 해결
국내 기업들, 인력 ·돈 ·시간 부족
오픈AI투자한 MS 중심 생태계, 승자독식 세상되나
국내 초거대 AI 기술 반드시 필요
전문인력 양성 등 정책 지원 시급

[이데일리 김현아 기자]

/ 로이터


역사상 최대 혁명으로 꼽히는 AI(인공지능)챗봇 ‘챗GPT’가 상용화되면서 한국의 IT 기업들이 비상이다. 특히 챗GPT의 ‘휴먼피드백강화학습(RLHF·Reinforcement Learning with Human Feedback)’이 진입 장벽으로 작동하고 있다.

2일 IT 업계에 따르면 오픈AI의 챗GPT에 대응하기 위해 네이버, 카카오, SK텔레콤, KT가 앞다퉈 ‘한국형 AI 챗봇 서비스’를 추진 중인 가운데, 챗GPT의 휴먼피드백강화학습(RLHF)기능을 따라잡을 수 있을지 걱정이 커지고 있다.

챗GPT는 사용자가 컴퓨터와 소통하는 방법을 바꿨다. 컴퓨터를 구동하는 방법을 아이콘 클릭(GUI)이 아닌 언어로 가능하게 하면서 채팅봇 형태로 서비스한다. 지금은 답변을 100% 신뢰하긴 어렵지만, 마치 어떤 주식을 살지 팔지 애널리스트들이 근거를 제시하는 것처럼, 챗GPT도 인간이 답을 택하는데 풍부한 근거를 제시해준다.

그런데 챗GPT는 비윤리적인 대화를 피하려고 사람의 힘을 빌린다. ‘휴먼피드백강화학습(RLHF)’이란 건데, 챗GPT가 내놓은 답을 사람이 90점, 80점 등 결과값을 낸 뒤 이를 강화학습시켜 최적의 안을 만든 뒤 다시 원래 학습 모델에 재학습시킨다.

오픈 AI 스스로도 ‘AI안전과 보안을 포함한 영역에서 초기 피드백을 위해 50명 이상의 전문가들과 일했다(we also worked over 50 experts for early feedback in domains including ai safety and security)’고 밝히고 있다. 오픈AI의 정직원은 375명에 불과하다.

배주호 한국외대 글로벌비즈니스&테크놀로지학부 교수는 지난 30일 이성엽 한국데이터법정책학회장(고려대 교수)이 주최한 ‘생성모델 AI에 대한 이해’를 주제로 한 포럼에서 “구글도 이 방법을 알았지만, 기계로 답을 찾는 와중에 오픈AI가 외주 인력을 싸게 구성해 과감하게 밀어붙인 것 같다”면서 “문제는 오픈AI가 이 파운데이션 모델을 공개하지 않으면서 기술의 진입 장벽이 생긴 것”이라고 지적했다.

네이버는 ‘서치GPT’, 카카오는 ‘코지피티’를 상반기 출시하기 위해 준비 중이고, SKT는 ‘에이닷’을, KT는 ‘믿음’ 상용화를 추진 중인데, 국내 기업들이 외주 인력을 고용해 ‘휴먼피드백강화학습’을 적용하기 녹록지 않다는 것이다.

그나마 네이버는 ‘지식iN’이라는 지식교류 서비스가 있어 우수 답변 데이터샛을 활용할 수 있지만, 답변의 질을 높이려면 외주 인력과 비용은 물론 상당한 시간이 필요할 것으로 보인다.



오픈AI에 지분 투자해 오피스와 보안 등 매주 1,2개씩 플러그인(plugin)과 서비스를 발표하는 마이크로소프트(MS) 중심으로 재편될 수 있다는 예상도 나온다. 배 교수는 “오픈AI가 기술공개를 종료한 것은 빌게이츠가 GPT-7까지 이미 본 것 아닌가 의심이 들게 한다”며 “글로벌 AI 생태계가 부익부빈익빈으로 급속히 재편될 수 있다”고 했다.

IT 업계 관계자는 “구글 바드가 나왔을 때 챗GPT와 똑같은 질문을 해서 다른 답이 나오자 구글 주가가 폭락했다”면서 “국내 초거대 언어모델(LLM·Large Language Model)개발사들은 오픈AI와 전면 경쟁을 벌여야 하는 상황”이라고 설명했다.

AI 스타트업들도 위험하긴 마찬가지다. 주로 기업 내부 문서 등 특정 분야에 AI를 적용하면서 파인튜닝(Fine-tuning)하는 데, 챗GPT가 이를 무용지물로 만들 수 있다. 파인튜닝은 쉽게 말해 특정 목적에 맞게 초거대 AI를 추가 학습시키는 것이다.

배 교수는 “최근 몇 년간 AI 스타트업들은 어느 정도 파인튜닝 된 분야에서 서비스해왔는데, 챗GPT 플러그인은 그냥 그런 인터페이스를 지원한다”면서 “챗GPT가 배워 서비스해버릴 수 있다. 그러면 이 분야만큼은 내가 확실하게 경쟁력이 있겠다 하는 AI 스타트업들은 어려워질 수 있다”고 걱정했다.

한편 우리나라에서 초거대 언어모델(LLM)을 개발하는 회사가 사라지면, 네이버·다음 덕분에 지킨 한국의 검색시장과 달리 AI 생태계는 글로벌 기업에 내주게 될 것이란 우려가 크다.

배주호 교수는 “국내에 기술이 있어야 한다는 건 변함이 없다. 네이버든, 카카오든, SKT든 KT든 여력이 있는 회사들은 우리 모델을 만들어야 한다. 놓아 버리면 돌이킬 수 없는 상황이 된다”면서 “단순히 휴먼피드백강화학습에서 랭킹을 매기는 수준이 아니라, 모델 자체에 어떻게 녹일까를 해결하는 전문 인력 양성에서 정책 지원이 시급하다”고 힘줘 말했다.