포켓몬고 데이터 익명화에 도움 준 한국 AI '데이터 라벨링 플랫폼'

by김현아 기자
2020.07.09 13:52:22

슈퍼브에이아이 김현수 대표 인터뷰
AI의 원료인 데이터 가공을 반자동으로 도와
포캣몬고 사진 자동차 번호판 익명처리에 활용
듀크대 AI 박사과정하다 귀국..SKT 출신 5명이 창업
와이콤비네이터 등에서 25억 시드 투자 받아

[이데일리 김현아 기자]

▲김현수(30) 슈퍼브에이아이 대표. 그는 美 듀크 대학에서 전자공학과 생명공학을 수석으로 졸업하고 인공지능 분야에서 박사과정으로 공부하던 중 SK텔레콤에 스카우트 돼 1년 6개월을 연구개발자로 일했다. 이후 2018년 4월 슈퍼브에이아이를 창업했다.


데이터를 원료로 인공지능(AI)를 개발하려는 기업들에게 데이터 라벨링은 필수코스다. AI가 학습할 데이터를 정제해 잘 학습할 수 있게 해줘야 성능 좋은 AI가 개발된다. 그런데 현재 데이터 라벨링은 우리나라에서만 1만여 명의 사람이 직접 수작업으로 할 정도로 비효율적이다.

AI 머신러닝 개발 앞단의 데이터 처리를 반자동화해서 효율성을 꾀할 순 없을까. 슈퍼브에이아이는 ‘머신러닝을 개발할 때 일하는 방식에서 혁명’을 추구하는 기업이다.

▲슈퍼브에이아이 사무실 입구. 서울 강남구 강남대로 500 5층이다. 6층에는 연구소가 있는데 여기서는 데이터 라벨링 회사와 AI 기술 기업 등을 대상으로 ‘데이터 라벨링 전문성 강화 프로그램’이 열리고 있었다.
▲슈퍼브에이아이의 ‘데이터 라벨링 전문성 강화’ 프로그램을 설명하는 푯말이다.


지난 6일 서울 논현동에 있는 슈퍼브에이아이 사무실. 출입문 앞에는 “Machine Learning Data Platform”이라는 글이 붙어 있다.

김현수(30)슈퍼브에이아이 대표는 “슈퍼브에이아이는 AI로 머신러닝 앞단의 데이터 라벨링을 반자동화 하는 기업”이라고 소개했다. 그는 “머신러닝 개발에 필요한 데이터를 정제해 받는 방식은 데이터 라벨러들이 데이터를 이메일 첨부파일로 받아 툴로 라벨링해서 보내주는 등 대부분 수작업인데, 이게 한번이 아니라 틀리면 수정해야 하고 계속 업데이트 해야 해서 불편했다. 이런 걸 반자동으로 데이터 라벨링은 물론 품질 관리, 분석까지 가능한 플랫폼을 개발했고, 이것이 바로 ‘스위트(Suite)’ 플랫폼”이라고 소개했다.

AI는 ‘자동화’ ‘지능화’라는데 머신러닝의 원료인 데이터 정제는 수작업으로 해왔다니. 김 대표는 소프트웨어 개발과 비슷한 흐름이라고 설명했다. 그는 “지금은 개발자 협업 도구나 관리도구가 굉장히 많아 국내외 개발자들이 함께 개발하고 효율화돼 있지만 10년 전만 해도 아주 불편하게 일했는데, 머신러닝 개발에도 비슷한 흐름이 나타난 것”이라고 설명했다.

그럼 슈퍼브에이아이의 데이터 플랫폼 ‘스위트’를 쓰면 데이터를 라벨링하는 시간을 줄일 수 있다는 말일까. 김 대표는 “실험해보니 최대 9.7배 빨리 라벨링할 수 있었다. 데이터마다 약간 차이가 나지만”이라고 말했다. 또 “스위트를 이용하면 데이터 구축에 참여하는 다양한 이해관계자의 어려움을 해결할 수 있다”고 부연했다. 재택을 하는 라벨러(인공지능이 학슥할 수 있도록 데이터를 1차 가공하는 사람)가 있다면 다운로드 기능을 막아 유출우려를 없애야 하고, 반대로 분석이나 관리하는 사람에게는 열려있어야 하는데 이런 문제를 해결해준다는 의미다.

▲김현수 슈퍼브에이아이 대표


김 대표는 ‘스위트’는 아직 베타 서비스 기간이지만 나이앤틱이 개발한 위치기반 증강현실 게임 포켓몬고의 데이터 익명 처리에도 활용되고 있다고 했다. 그는 “포켓몬고에서 사진에 찍힌 행인의 얼굴이나 자동차 번호판 등이 자사 데이터베이스에 있어면 안 돼 익명화를 위한 머신러닝 개발을 진행 중인데, 이를 우리 플랫폼으로 한다”면서 “개발이 완료되면 사진을 찍어 그쪽 서버로 업로드되는 데이터가 익명화되는 것”이라고 설명했다.



이처럼 ‘스위트’는 기술인력이 없는 1차 데이터 가공 라벨링 에이전시뿐 아니라, 데이터를 가지고 AI를 개발하는 기업들에게도 도움을 준다.

김현수 대표는 美 듀크 대학에서 전자공학과 생명공학을 수석으로 졸업하고 인공지능 분야에서 박사과정으로 공부하던 중 SK텔레콤에 스카우트 돼 1년 6개월을 연구개발자로 일했다. 그가 28세이던 2018년 4월 슈퍼브에이아이를 창업했다. 당시 그와 함께 창업에 나선 이정권 CTO, 이종혁 공동창업자, 차문수 공동창업자, 이현동 공동창업자 모두 SK텔레콤 출신이다. 이정권 CTO는 논문 피인용이 4000회에 달할 정도로 AI 분야에서 알려진 연구자이며, 이종혁 공동창업자는 국제 정보올림피아드 대한민국 대표 출신이다.

김 대표는 “학생 때나 대기업에 있었을 때 연구는 빨리 되고 있는데 산업에 바로 적용돼 실생활에 적용되는 게 굉장히 느리다고 생각하게 됐다”며 “처음에는 연구레벨로 논문을 내다가 기술이 성숙한 걸 느끼고 서비스를 출시하는 게 훨씬 낫겠다고 생각하게 됐다”고 창업 이유를 밝혔다.

그는 초등학교 5학년때까지 한국에서 다니다 싱가포르에서 중·고교를 나왔고 군대도 갔다 왔다. 슈퍼브에이아이 창업 직후 낸 비즈니스모델 특허는 얼마전 국내에 등록됐다.

▲김현수 슈퍼브에이아이 대표
슈퍼브에이아이의 본사는 미국에 있다. 그는 “미국 쪽 시장이 워낙 크고 실리콘밸리 회사들과 경쟁해야 해서 그랬다”고 했다. 하지만 직원은 기술 개발과 국내 사업을 하는 한국이 더 많다.

슈퍼브에이아이는 창업한 지 1년도 안된 2019년 초 스타트업 업계의 명문 액셀러레이터인 와이콤비네이터, 듀크대, 뮤렉스파트너스, KT인베스트먼트, 페가수스테크벤처스 등으로부터 25억 원의 시드 투자를 받았다.

세계적으로 슈퍼브에이아이와 비슷한 사업모델을 하는 회사는 ‘라벨박스’라는 회사가 있다. 김 대표는 “우리처럼 머신러닝 데이터플랫폼을 지향하는 회사로 3,4년이 됐고 펀딩은 우리보다 많이 받았지만 기술과 제품은 차이가 나지 않는다”고 했다.

그는 “정부의 디지털 뉴딜 정책의 핵심인 데이터 댐 사업에 도움이 되기 위해 노력하고 있다”면서 “이미지와 동영상외에 텍스트 데이터 등으로 처리 분야를 늘리고 AI 기술을 고도화하고 싶다”고 밝혔다.

슈퍼브에이아이는 정부(NIA)주도로 만들어지는 오픈소스 데이터셋에서 AI학습용 데이터 프로젝트 중 한글 데이터셋 구축을 맡았다. 올해는 항공위성, 사람동작 데이터셋 부분을 맡는다.