신분증에서 원하는 정보만 쏙…네이버, '도큐먼트 OCR' 출시

by김국배 기자
2021.03.11 13:08:39

AI로 형태, 양식 제각각인 문서 인식 정확도 향상
사전 승인 거친 기업에만 제공

(사진=네이버클라우드)


[이데일리 김국배 기자] 네이버클라우드가 영수증 같은 정형화되지 않은 문서에서 원하는 정보만 추출할 수 있는 문자인식(OCR) 서비스를 선보인다.

네이버클라우드는 11일 ‘클로바 도큐먼트 OCR’ 서비스를 출시했다.

이 서비스는 인공지능(AI) 기술로 영수증, 사업자 등록증, 명함 등 형태와 양식이 제각각인 문서를 인식하는 성능을 향상시켰다. 글자 위치 등에 관계없이 문서에서 상호, 지점명, 사업자번호 등 주요 정보를 추출해 항목별로 분류해준다.



심지어 구겨지거나 오염된 각종 서류에서 텍스트를 추출하고, 항목별로 자동 기입할 수 있다는 게 회사 측 설명이다. 이 기술은 협업툴 네이버웍스, 명함앱 리멤버 서비스에도 활용되고 있다.

회사 측은 “이번 서비스 출시로 발급기관이 상이하거나 위·변조 방지 기술이 적용돼 OCR을 적용하기 까다로웠던 분야까지 문서 인식이 가능해졌다”고 했다.

네이버클라우드는 이 서비스를 사전 신청 절차를 거쳐 승인받은 기업에만 선별적으로 제공한다. 민감 정보가 포함된 신용카드, 주민등록증 등에 OCR를 적용할 때 철저한 보안이 요구되기 때문이다.

한상영 네이버클라우드 상무는 “OCR의 활용 분야가 다각화되며 비즈니스 현장의 핵심 기술로 자리매김하고 있다”며 “향후 도큐먼트 OCR 특화 모델을 지속적으로 확장하고 네이버 클라우드 플랫폼의 다른 서비스와 연계해 차별화된 서비스를 제공하겠다”고 말했다.