유회준 교수 연구팀이 개발한 AI 반도체는 다중-심층 신경망을 처리할 수 있고 이를 저전력의 모바일 기기에서도 학습할 수 있다. 이번 반도체 칩 개발을 통해 이미지 합성, 스타일 변환, 손상 이미지 복원 등의 생성형 AI 기술을 모바일 기기에서 구현하는 데 성공했다.
|
◇모바일 기기서 다양하게 사용 가능…산업계도 주목
기존에 많이 연구된 AI 기술인 분류형 모델(Discriminative Model)은 주어진 질문에 답을 하도록 학습된 AI 모델로 물체 인식 및 추적·음성인식·얼굴인식 등에 활용된다. 반면 생성적 적대 신경망(GAN)은 새로운 이미지를 생성·재생성할 수 있어, 이미지 스타일 변환, 영상 합성, 손상된 이미지 복원 등 광범위한 분야에 활용된다. 모바일 기기의 다양한 응용 프로그램(영상·이미지 내 사용자의 얼굴 합성)에도 사용돼 학계뿐만 아니라 산업계에서도 주목을 받고 있다.
그러나 생성적 적대 신경망은 기존의 딥러닝 네트워크와는 달리 여러 개의 심층 신경망으로 이루어진 구조로, 개별 심층 신경망마다 다른 요구 조건으로 최적화된 가속을 하는 것이 어렵다. 또 고해상도 이미지를 생성하기 위해 기존 심층 신경망 모델보다 수십 배 많은 연산량을 요구한다. 즉, 적대적 생성 신경망은 연산 능력이 제한적이고 사용되는 메모리가 작은 모바일 장치(스마트폰, 태블릿 등)에서는 소프트웨어만으로 구현할 수 없었다. 최근 모바일 기기에서 AI를 구현하기 위해 다양한 가속기 개발이 이뤄지고 있지만, 기존 연구들은 추론 단계만 지원하거나 단일-심층 신경망 학습에 한정돼 있다.
|
이번에 개발된 AI 반도체는 서버로 데이터를 보내지 않고 모바일 장치 내에서 생성적 적대 신경망(GAN)을 스스로 학습할 수 있어 사생활 보호를 가능하게 하는 프로세서라는 점에서 활용도가 기대되고 있다. 모바일 기기에서 저전력으로 다중-심층 신경망을 가속하기 위해서 다양한 핵심 기술이 필요하다.
◇‘심층 신경망 학습 반도체’ 대비 4.8배 에너지효율
연구팀이 개발한 GANPU에 사용된 핵심 기술 중 대표적인 기술 3가지는 △적응형 워크로드 할당(ASTM, 처리해야 할 워크로드를 파악해 칩 상의 다중-심층 신경망의 연산 및 메모리 특성에 맞춰 시간·공간으로 나누어 할당함으로써 효율적으로 가속하는 방법) △입출력 희소성 활용 극대화(IOAS, 인공신경망 입력 데이터에서 나타나는 0뿐만 아니라 출력의 0도 예측해 연산에서 제외함으로써 추론 및 학습 과정에서의 속도와 에너지효율 극대화) △지수부만을 사용한 0 패턴 추측(EORS, 인공신경망 출력의 0을 예측하기 위한 알고리즘으로 인공신경망 입력과 연결 강도(weight)의 부동소수점 데이터 중 지수 부분만을 사용해 연산을 간단히 수행하는 방법)이다.
|
유회준 교수는 “이번 연구는 하나의 칩에서 추론만이 아니라 학습까지 모두 가능해 여러 개의 딥러닝 네트워크를 동시에 지원하는 AI 반도체를 개발했다는 점에서 의미가 크다”며 “모바일 기기에서의 AI 활용 영역을 크게 넓혀 향후 이미지 스타일 변환, 영상 합성, 이미지 복원 등 GAN과 관련된 애플리케이션에 다양하게 응용될 것”이라고 기대감을 드러냈다.