비큐AI, 생성형 AI 학습용 ‘전문 지식’ 데이터 추가 확보… “기업향 데이터 공급 확대”

by박정수 기자
2024.09.26 08:51:14

[이데일리 박정수 기자] 인공지능(AI) 데이터 통합 플랫폼 서비스 기업 비큐AI(148780)는 소셜 Q&A 커뮤니티 ‘아하’ 운영사 ‘아하앤컴퍼니’와 데이터 공급 계약을 체결했다고 26일 밝혔다. 이번 계약으로 비큐AI는 미디어, 스톡 콘텐츠에 이어 법률, 의료, 재무, 부동산 등 다양한 분야의 고품질 전문지식 데이터셋을 추가 확보하게 됐다.

비큐AI는 확보한 데이터셋을 ‘대규모 언어모델(LLM)’ 학습 및 다양한 AI 플랫폼 서비스에 적합한 형태로 전처리 및 라벨링한 후, 서비스 중인 자체 개발 생성형 AI 데이터 플랫폼 서비스 ‘RDPLINE(Real-time Data PipeLine)’에 적용할 계획이다.

아하앤컴퍼니가 운영하는 ‘아하’는 궁금한 점을 질문하면 분야별 검증된 전문가와 다양한 사용자들로부터 집단 지성 답변을 받을 수 있는 Q&A 커뮤니티다. 약 350만건 이상의 고품질 전문가 질의응답(QA) 데이터셋을 보유하고 있으며 9월 기준 전체 질의응답 수는 1000만건을 넘어섰다. 특히 최근 월평균 순방문자 수(UV)가 1300만명을 돌파하는 등 급성장세를 이어가고 있다.

생성형 AI 모델의 정확도를 극대화하기 위해서는 대량의 데이터 확보가 필요하다. 다만, 저작권 및 기술적 문제로 인해 많은 생성형 AI 서비스 기업들이 데이터 확보에 어려움을 겪는 상황이다.



비큐AI의 RDPLINE은 관련 문제를 해결하는 데 최적화된 솔루션으로 비큐AI가 쌓아온 수억 건의 고품질 언론 데이터와 실시간 뉴스, 영상, 이미지 데이터 등을 합법적으로 손쉽게 확보할 수 있다. RDPLINE이 더욱 다양해진 데이터를 제공할 수 있어진 만큼 압도적 우위를 유지할 수 있을 것이라고 회사 측은 설명했다.

회사 관계자는 “이번 계약으로 비큐AI가 정교하고 신뢰성 높은 AI 기반 기술을 개발하는 데 핵심적인 역할을 할 수 있을 것”이라며 “비큐AI는 법적 리스크가 해소된 다양한 생성형 AI 학습 및 실시간 데이터를 필요로 하는 AI 서비스 기업들에게 가장 빠르고 안정적으로 지속 제공해 이들의 서비스 경쟁력을 높이는 데 앞장서겠다”고 말했다.

그는 이어 “앞으로도 다양한 생성형 AI 학습용 데이터 관련 파트너십을 지속적으로 확대하고, AI 학습 데이터 생태계를 강화해 나가겠다”며 “기존 미디어 데이터 외에 추가 데이터셋 확보를 통해 AI 기술 발전에 필수적인 데이터 인프라 제공 기업으로서의 입지를 강화할 것”이라고 덧붙였다.