X

[AI] “데이터 라벨러, 인형 눈알 붙이기 아닙니다”

이대호 기자I 2021.05.30 17:29:51

박민우 크라우드웍스 대표 인터뷰
자율주행·의료 데이터 라벨링 등 교육 거쳐야 작업
전업 시 4000만원 넘는 수익 올리기도
데이터 정확도 99% 이상 품질 유지 중요
“더 좋은 조건에서 일할 수 있도록 잡매칭 준비”

박민우 크라우드웍스 대표(사진=크라우드웍스)


[이데일리 이대호 기자] 데이터 라벨러. 인공지능(AI) 시대 들어 주목받고 있는 직업이다. AI가 학습 데이터를 쉽게 인식할 수 있도록 전처리(前處理)하는 작업자를 일컫는다. 강아지는 강아지, 고양이는 고양이 이런 방식으로 데이터에 라벨(정보표시)을 붙인다고 보면 된다.

이 데이터 라벨링은 관련 전문가만 하는 작업이 아니다. 일반 대중도 할 수 있다. 국내에선 크라우드웍스가 이러한 시장 흐름을 주도하고 있다. 지난 2017년 4월 설립된 이 회사가 데이터 라벨링 작업에 크라우드소싱(대중참여) 방식을 처음 채택한 뒤 우후죽순 뒤따르는 기업이 생겼다. 정부에서도 혁신 사례로 주목해 대통령 산업포장을 수여하는 등 수많은 수상 실적을 확보했다.

[이데일리 김정훈 기자]


◇수백개 객체 가공하기도…전업 시 4000만원 넘는 수익도

박민우 크라우드웍스 대표는 최근 서울시 강남구 테헤란로 사무실에서 가진 인터뷰를 통해 “데이터 라벨링 작업을 ‘인형 눈알 붙이기’로 오해한다”며 데이터 라벨러 직업에 대한 잘못된 인식을 털어놨다.

앞서 국회 과방위 야당 의원들은 “디지털 뉴딜 일자리를 21세기형 인형 눈알 붙이기다라는 말이 있다”며 “단기 일자리 논란을 아는가”라고 공격하기도 했다.

하지만 박 대표는 “이미지 해상도에 따라 수백개 객체가 나올 수도 있다”며 “이를 가공하는 데 시간과 노력이 꽤 많이 들어간다”고 말했다. 예를 들면 자율주행을 위한 고해상도 이미지를 1장 가공하는데 4시간을 들일 때도 있다. 엑스레이와 초음파 사진 가공도 고도의 집중력이 필요하다. 배달 리뷰 키워드 처리부터 사진 속 신체 골격이나 동영상 속 이상행동 프레임 추출 등 텍스트와 사진뿐 아니라 음성, 영상물의 데이터 가공도 이뤄진다.

크라우드웍스에 따르면 전업 수준으로 데이터 라벨링 작업에 참여하는 노동자는 연 기준 4000만원 이상 벌어가기도 한다. 이 정도로 작업에 참여하려면 여러 교육 프로그램을 통과해야 한다. 이 기준을 충족하는 크라우드웍스의 데이터 라벨러는 3만명 정도다. 누적 확보한 전체 라벨러는 25만명이 넘는다. 이 중 5만명 가량이 한 달에 한 건 이상 작업에 참여하고 있다.

AI 학습 데이터 수집 가공 유형(자료=크라우드웍스)


◇여전히 데이터 부족…인적 자원 필요

박 대표는 “AI 기술 보편화 진행이 빨리 안 됐던 이유가 데이터 부족 때문”이라며 “소스 데이터가 부족한 게 아니라 사진 속 고양이를 레이블링(표시)해야 학습이 되는데 이러한 데이터는 수많은 인적 자원을 필요로 했다”고 데이터 라벨링 활성화 전 상황을 전했다.

당시 기업들이 매번 수십명의 계약직을 뽑고 데이터 전처리를 가르치는 번거로운 과정을 겪고 있었다. 교육을 마친 인력의 공유도 안 돼 비용 측면에서 낭비가 심했다. 크라우드웍스가 이 과정을 보다 전문화해 선제적으로 시장에 뛰어들었고 플랫폼 경제를 탄생시켰다.

박 대표는 “네이버 AI 서비스에 활용된 데이터는 저희가 다 가공했다고 보면 될 것”이라며 “카카오, 현대차, SK하이닉스 등 AI를 한다는 대기업은 물론 AI 스타트업 등 300곳 이상을 고객사로 확보하고 있다”고 자신감을 보였다.

크라우드웍스 로비에 진열한 각종 표창(사진=크라우드웍스)


크라우드웍스는 데이터 정확도 99%를 자신했다. 그 이유를 100% 전수 검사로 꼽았다. 박 대표는 “크라우드소싱 방식으로 데이터를 전처리하면 평균 정확도가 70% 이하로 나온다”며 “크라우드웍스에선 100% 전수 검수한다”고 강조했다.

AI 데이터 전처리 작업만큼 검수 과정도 중요하다. 반려가 몇 번 이상 반복되면 검수 작업을 못 하도록 하는 사업모델(BM) 특허 등을 갖추고 있다. 현재 130개 특허(국내외 등록 104건, 출원 26건)를 보유 중이다.

◇알바? NO 실력자들 연결한다…‘크라우드잡스(가칭)’ 준비

크라우드웍스는 올해 말 ‘크라우드잡스(가칭)’를 선보인다. 여러 프로젝트에 참여하면서 검증을 거친 데이터 라벨러들을 적재적소의 일자리에 중개해주는 플랫폼이다.

박 대표는 기업보다는 데이터 라벨러의 입장에서 크라우드잡스의 성격을 정의했다. 그는 “활동 기록 로그도 있고 평가지표도 있어 우수한 사람들을 파견이나 재택으로 일할 수 있도록 하는 것이 가능하다”며 “크라우드웍스 회원들이 더 좋은 조건에서 많은 이익을 얻을 수 있도록 잡과 매칭하는 사업을 한다고 보면 될 것”이라고 힘줘 말했다.

주요 뉴스

ⓒ종합 경제정보 미디어 이데일리 - 상업적 무단전재 & 재배포 금지