연기 자욱한 재난 현장에서도 계단 오르내릴 수 있는 로봇 개발

by강민구 기자
2023.03.29 08:59:17

KAIST, AI 심층 강화학습 기반 로봇 제어기술 선보여

[이데일리 강민구 기자] 국내 연구진이 연기가 자욱해 앞이 안보이거나 울퉁불퉁한 환경에서도 넘어지지 않고, 움직이는 사족 보행 기술을 선보였다.

한국과학기술원(KAIST)은 명현 전기전자공학부 교수 연구팀이 다양한 비정형 환경에서도 ‘블라인드 보행(blind locomotion)’을 할 수 있는 보행 로봇 제어 기술을 개발했다고 29일 밝혔다.

사족 보행 기술을 개발한 KAIST 연구진고 사족보행 로봇 ‘드림워커’.(왼쪽부터) 명현 교수, 이 마데 아스윈 나렌드라 박사과정, 유병호 박사과정, 오민호 박사과정.(사진=KAIST)
연구팀은 사람이 수면 중 깨어서 깜깜한 상태에서 화장실을 갈 때 시각적인 도움을 거의 받지 않고 보행을 할 수 있는 것에 착안해 ‘드림워크(DreamWaQ)’라는 기술을 개발했고, 해당 기술을 적용한 로봇을 ‘드림워커(DreamWaQer)’라고 이름 지었다.

기존 보행 로봇 제어기는 기구학이나 동역학 모델을 기반으로 하는 모델 기반 제어 방식을 이용한다. 비정형적인 환경에서 안정적으로 보행하려면 모델의 특징 정보를 더 빠르게 얻을 수 있어야 하지만 주변 환경의 인지 능력에 많이 의존했다.

연구팀은 인공지능 학습 방법 중 하나인 심층 강화학습 기반의 제어기를 통해 시뮬레이터에서 얻은 다양한 환경 데이터를 통해 보행 로봇의 각 모터에 적절한 제어 명령을 빠르게 계산해주도록 했다.

시뮬레이션에서 학습된 제어기가 실제 로봇에서 잘 작동하려면 별도의 튜닝 과정이 필요했다면 연구팀이 개발한 제어기는 별도 튜닝을 요구하지 않는다. 때문에 다양한 보행 로봇에 쉽게 적용할 수 있다.



제어기는 크게 지면과 로봇 정보를 추정하는 상황 추정 네트워크와 제어 명령을 산출하는 정책 네트워크로 구성된다. 상황추정 네트워크는 관성 정보와 관절 정보들을 통해 암시적으로 지면 정보를, 명시적으로 로봇 상태를 추정한다. 정보는 정책 네트워크에 입력돼 최적의 제어 명령을 산출한다.

상황추정 네트워크는 지도학습을 통해 학습하고, 정책 네트워크는 심층 강화학습 방법론인 행동자·비평자 방식으로 학습한다. 모든 학습 과정에는 단 1시간 정도만 소요되며, 실제 로봇에는 학습된 행동자 네트워크만 탑재된다. 주변 지형을 보지 않고도, 오직 로봇 내부의 관성 센서(IMU)와 관절 각도의 측정치를 활용해 시뮬레이션에서 학습한 다양한 환경 중 어느 환경과 유사한지 상상한다.

갑자기 계단을 오르내기게 되면 발이 닿는 순간 빠르게 지형 정보를 상상한다. 이렇게 추측된 지형 정보에 알맞은 제어 명령을 각 모터에 전달해 재빠른 적응 보행이 가능하다.

실제 시험실을 비롯해 대학 캠퍼스, 나무뿌리와 자갈이 많은 야지 환경에서 보행 시 지면으로부터 몸체까지 높이의 3분의 2 정도의 계단을 이용했다. 또 환경과 관련 없이 초속 0.3m의 느린 속도부터 1m의 빠른 속도까지 안정적으로 보행했다.

연구 결과는 오는 5월 말 영국 런던에서 개최되는 로보틱스 분야 세계 최고 권위 학회인 ‘ICRA(IEEE International Conference on Robotics and Automation)’에서 발표될 예정이다.