지난해 3월 ‘알파고’가 국내 가장 큰 이슈 중 하나였습니다. 알파고가 인간과의 바둑 대결에서 이겼기 때문이죠. 하지만 컴퓨터가 사람을 이긴 것은 알파고가 처음이 아닙니다.
지난 2011년 IBM에서 개발한 ‘왓슨’이라는 인공지능(AI)이 퀴즈쇼 ‘제퍼디’에서 인간을 제치고 우승을 차지했습니다. 당시 참가자 두 명은 제퍼디 쇼에서 이전에 최고 성적을 냈던 참가자로 굉장한 퀴즈 실력을 갖춘 사람들이었죠. 이 퀴즈쇼는 사회자가 어떤 단어에 대해 설명을 하면 제일 먼저 부저를 누르고 정답을 말하는 사람이 베팅한 만큼 상금을 가져갈 수 있는 퀴즈쇼입니다.
|
왓슨은 어떻게 퀴즈쇼에서 이길 수 있었을까요?
왓슨은 퀴즈쇼 이전에 굉장히 많은 데이터들이 입력된 상태였습니다. 백과사전, 수많은 서적, 웹상의 자료 등 개발자들이 이미 입력해 놓았습니다. 왓슨이 사회자로부터 질문을 받으면 기존에 입력된 데이터들 중 가장 가능성이 있는 답들을 수집하고, 가능성 있는 답들 중 얼마나 정답에 근접할 수 있는지 근거를 찾고 평가를 합니다. 그 중 가장 높은 평가를 받은 답을 정답으로 결정하고 부저를 누르게 되는 것이죠.
예를 들면 “펨브로크 칼리지와 엠마뉘엘 칼리지의 성전을 설계한 건축가는?”이라는 질문을 사회자가 하게 되면, 왓슨은 우선 해당 문장을 ‘펨브로크 칼리지’, ‘엠마뉘엘 칼리지’, ‘건축가’를 나눠 검색을 합니다. 이 단어들이 포함된 문서들을 뽑아내고 이중 가장 많이 등장하는 건축가 5명을 정답 후보로 수집합니다. 이 5명의 정답 후보 중 문제에 포함된 단어들과의 관계가 가장 높은 것을 찾고 평가를 해, 가장 높은 가능성이 있는 답을 선택하고 정답을 외치는 것이죠.
|
데이터 분석 얘기에 왜 자꾸 왓슨 얘기와 AI 얘기가 나오는지 의아할 수도 있습니다. 바로 데이터 분석이 AI의 기반이 됩니다. 많은 데이터가 있어야 기계가 더 많이 학습을 하고 더욱 똑똑해질 수 있는 것이죠. 알파고가 수많은 기보를 통해 학습을 했다는 것은 아마 이제는 다들 아는 얘기일 것입니다.
알파고와 왓슨은 약간의 차이점이 있습니다. 바둑대결을 했던 알파고는 다양한 경우의 수를 추론하는 게임을 통해 개발이 된 반면, 왓슨은 방대한 자료를 분류해 둔 데이터 베이스를 활용하고 특정 질문에 가장 가까운 답을 찾아내는 데에 보다 초점을 맞춰졌습니다.
|
다음주에는 인간과 AI의 번역 대결이 있다고 합니다. 이번에는 AI가 아닌 인간이 이길 것이라는 예측이 좀더 우세합니다. 사람의 언어를 정확히 이해하고 이를 자연스럽게 표현한다는 것은 그만큼 쉬운 일이 아니기 때문입니다. 언어를 완벽하게 이해하고 표현하는 것만큼은 컴퓨터가 좀더 학습이 필요한 것 같습니다.