과학기술정보통신부는 유회준 한국과학기술원(KAIST) 교수 연구팀이 AI 반도체 기술 ‘옴니DRL(omniDRL)’을 개발했다고 16일 밝혔다.
|
인간이 미리 만든 데이터, 정답 쌍을 이용해 인공지능을 학습시키는 지도학습 방법과 달리 심층 강화학습은 인공지능이 시행착오로 얻은 경험을 이용해 스스로 최적의 답을 찾고, 인간이 그 결과에 피드백을 줘야 한다.
이 방식은 대규모 데이터를 처리해야 하기 때문에 대용량 메모리를 가진 고성능 컴퓨터 여러 개를 병렬로 연결해야 구현할 수 있었다. 연산 능력이 제한적인 스마트폰 등 모바일 기기에서는 심층 강화학습을 구현하기 어려웠다.
이에 연구팀은 모바일 기기 등에서도 심층 강화학습이 가능하도록 기존 대비 성능이 우수하고 특히, 전력효율이 2.4배 높은 인공지능 반도체 기술인 ‘OmniDRL’을 개발했다. 정수 단위 연산만 할 수 있던 기존 PIM 반도체와 달리 부동 소수점 기반 연산을 도입했고, 데이터 압축 상태로 연산 등을 할 수 있도록 했다.
연구팀이 개발한 기술을 ‘인간형 로봇 적응 보행 시스템’에 적용한 결과, 이 기술이 연결되지 않았을 때보다 7배 이상 빠른 속도로 적응 보행을 할 수 있었다.
유회준 교수는 “한 개의 반도체에서 심층 신경망을 높은 압축을 유지한 상태로 추론이나 학습이 가능해졌고, 불가능했던 소수점 연산을 할 수 있는 인공지능 반도체 기술을 개발했다”며 “앞으로 지능형 로봇 조종, 자율주행 드론, 게임 등 다양한 분야에 응용할 수 있을 것”이라고 말했다.
연구결과는 지난 6월 14∼19일 열린 반도체 분야 학회인 ‘IEEE VLSL 기술 및 회로에 대한 심포지엄’에서 발표됐다.