X

쏘카 “적은 데이터셋으로도 효율적인 딥러닝”..연내 AI고객센터

이 기사 AI가 핵심만 딱!
애니메이션 이미지
김현아 기자I 2023.05.02 10:36:11

쏘카, 국제 딥러닝 컨퍼런스 ‘ICLR 2023’에서 연구 발표
적은 데이터셋 환경에서의 효율적인 딥러닝 사례 소개
쏘카 AI 모델 개발 중…연내 AI 고객센터 도입

[이데일리 김현아 기자]
쏘카 AI팀 사진 (왼쪽부터) 원혜진 매니저, 박경호 팀장, 김현수 매니저. 사진=쏘카


쏘카가 연내 인공지능(AI) 고객센터를 만든다.

쏘카는 플랫폼 운영을 통해 얻은 자연어 데이터를 기반으로 쏘카 도메인을 가장 잘 이해할 수 있는 AI 모델을 개발 중이다. 이르면 연내 해당 AI 모델을 기반으로 한 AI 고객센터 솔루션을 도입할 계획이다.

이를 위해 쏘카는 거대언어모델 (Large Language Model; LLM)을 자체적으로 연구 및 개발하여 대화형 AI를 구축 중이다. 대화형 AI는 고객의 발화 의도를 이해하고 이에 적합한 응답을 생성하여 차량 이용 중 발생하는 문의에 신속하고 정확하게 응대할 수 있다.

또, 쏘카가 자체 연구개발한 STT (Speech-to-Text) 기술을 통해 고객과 상담사 사이의 통화내용을 텍스트 처리하고, 고객 질의 내용을 분석하여 서비스를 개선할 수 있을 것으로 기대하고 있다.

자체 LLM 개발 중…딥러닝 연구 성과 발표

자체 AI 모델을 개발 중인 쏘카의 AI팀(팀장 박경호)은 딥러닝 분야 세계 최고 권위의 컨퍼런스 ‘ICLR 2023’ 워크숍에서 딥러닝 연구 성과를 발표한다.

5일 ICLR(International Conference on Learning Representations)에서 운영하는 워크숍 PML4DC(Practical Machine Learning for Developing Countries)에 참석해 딥러닝 연구 논문을 발표하는 것.

먼저 데이터 리소스가 부족한 환경에서 효율적으로 데이터를 학습시킬 수 있는 사례를 소개한다.

이 논문은 ‘공개 의도 분류에 대한 보정 효과 분석(Uncovering Effectiveness of Calibration on Open Intent Classification)’에 대한 것이다. 딥러닝 모델이 실제값과 예측값의 차이를 계산하는 크로스 엔트로피 손실(Cross Entropy Loss)에 대한 것으로, 데이터를 학습할 경우 생기는 손실값(loss)에 보정(calibration)을 추가하는 방법을 제안한다.

또, 문장 분류 문제에서 기존 학습 데이터에 포함되지 않은 카테고리 문장이 주어지는 상황에서 딥러닝 모델이 이를 별도의 OOD(out-of-distribution) 라벨로 분류하는 방법과 데이터셋이 적은 환경에서 문장 분류 문제를 효과적으로 풀어낸 수 있는 방법을 담았다.

두번째 논문에선 ‘텍스트 데이터 증강을 위한 품사 대체와 특징 공간 보간(PMixUp: Simultaneous Utilization of Part-of-Speech Replacement and Feature Space Interpolation for Text Data Augmentation)’하는 방안을 제안했다.

데이터가 충분하지 않아 효과적인 모델 학습이 어려운 상황에서 유의어로 교체(Synonym Replacement)와 특징 공간 보간(Feature Space Interpolation)을 동시에 적용한 데이터 증강(Data Augmentation) 기법을 소개했다. 이 기법을 활용하면 데이터가 부족한 상황에서도 문장 분류 문제를 뛰어난 성능으로 풀어낼 수 있다.

쏘카AI팀(박경호 팀장, 원혜진 매니저, 김현수 매니저)은 “세계 최고 권위 학회에서 쏘카의 딥러닝 연구 성과를 공유할 수 있는 좋은 기회”라며 “이번 연구를 발판 삼아 쏘카에서 발생할 수 있는 다양한 문제를 데이터와 기술을 활용해 해결하고 효율화할 수 있는 방안을 연구해나가겠다”고 말했다.

한편, 쏘카는 앱과 차량 등 플랫폼을 통해 얻을 수 있는 여러 데이터를 AI와 접목해 운영 효율화를 이뤄내고 있다.

차량 사고 부문에서는 고객이 쏘카를 이용하기 전후 올리는 사진 데이터, 차량관제단말기의 DR-GPS 센서 데이터, 블랙박스의 영상 데이터를 활용해 차량의 파손과 사고 여부를 AI 모델을 통해 자동으로 처리하고 있다. 차량 세차 영역에선 이미지를 통한 차량의 오염 여부 판단, 고객 또는 세차원의 세차 퀄리티 확인 및 세차 인증 등을 자동화해 운영하고 있다.

이 기사 AI가 핵심만 딱!
애니메이션 이미지

주요 뉴스

ⓒ종합 경제정보 미디어 이데일리 - 상업적 무단전재 & 재배포 금지