|
개발진은 대규모 언어 모델이 가진 환각 현상 등 한계를 극복하기 위해 검색 증강 생성 기술을 도입했다.
이를 통해 규정 전문을 단어 수준으로 쪼개고, 쪼갠 단어를 수치화해 사용자의 질문을 수치화한 값과 가장 근접한 결과를 도출해 냈다. 검색 증강 생성 기술이 도출한 결과는 대규모 언어 모델에 전달되고 다시 문장 형태로 변환돼 사용자에게 제공된다.
에너지연은 현재 152개의 규정을 보유해 단어 검색을 통해 원하는 정보를 찾고 정확한 의미를 해석하기에는 많은 시간이 소요된다. 반면 해당 시스템을 이용하면 원하는 규정을 즉시 확인하고, 문장 의미도 함께 해석돼 규정 검색에 들이는 시간을 줄일 수 있다. 검색 증강 생성 기술의 정밀도 평가 지표(RAGAS)를 활용한 결과, 시스템이 도출한 답변은 90% 이상의 높은 정확도를 기록했다.
개발된 시스템은 데이터의 외부 유출을 방지하기 위해 외부망과 연동되지 않은 상태에서도 작동할 수 있다. 규정 외에도 내부 게시판, 연구 논문 정보 등 모든 데이터의 적용이 가능해 기업과 기관의 특성에 맞는 형태로 활용할 수 있다.
기술을 이전받은 아이티메이트는 해당 기술과 기업이 보유한 AI 기술을 적용해 공공기관용 전사적 자원 관리 시스템 선진화를 추진할 계획이다.
송영배 에너지연 지식정보실장은 “AI 챗봇 시스템을 통해 규정 검색의 효율성과 정보 접근성이 향상될 것으로 기대한다”며 “향후 출연연 행정 업무의 효율화를 선도할 수 있는 기반이 마련된 것”이라고 말했다.