인간 뇌 닮은 '슈퍼AI' GAFA·테슬라가 만든다

by김상윤 기자
2021.09.07 05:00:00

[미래기술25-지능형반도체]①
구글 '알파고'…CPU만 천여개 연결
대량 데이터 처리…높은 효율 갖춘 반도체 필요
엔비디아 GPU 잡아라…글로벌 테크 기업 추격전

2016년 3월 구글의 ‘알파고’가 이세돌 9단을 이겼을 때 세상은 충격에 빠졌습니다. 이세돌의 압도적인 승리를 예상했지만 기술의 발전은 예상보다 훨씬 빨랐습니다. 알파고는 인공지능(AI) 연산을 위해 중앙처리장치(CPU) 1202개와 그래픽처리장치(GPU) 176개를 연결한 것으로 전해집니다. 하나의 CPU만으로는 대규모 데이터 처리 능력이 떨어지기 때문에 여러 CPU를 연결하고 여기에 ‘인공지능 가속기’인 GPU까지 결합한 ‘슈퍼 컴퓨터’를 만든 겁니다. GPU는 원래 3D그래픽을 처리하기 위해 개발됐지만 방대한 데이터를 동시에 처리할 수 있는 기능을 갖춰 알파고의 AI에 활용됐습니다.

문제는 이런 시스템의 전력소모가 너무 크다는 점입니다. 사람의 뇌처럼 수많은 데이터를 처리하려면 높은 전력효율은 필수입니다. 아무리 좋은 성능을 갖춘 컴퓨터라더라도 기계가 지나치게 거대하고 에너지 소비량이 많다면 대중화하긴 어렵습니다. 이런 한계를 극복하기 위해 만들어진 게 바로 ‘지능형 반도체’입니다. <편집자주>

[이데일리 김상윤 기자] 반도체는 크게 메모리반도체와 비(非)메모리반도체로 나뉩니다. 전통적인 컴퓨터는 D램과 중앙처리장치(CPU)로 이뤄져 있는데, D램이 메모리반도체, CPU가 비메모리반도체입니다. 메모리반도체는 데이터를 저장하는 기능을, 비메모리반도체는 데이터를 연산, 처리하는 기능을 갖고 있습니다. 컴퓨터는 D램의 데이터를 CPU가 가져와 연산하고 이것을 다시 D램으로 보내 저장시키는 과정을 반복하는 형식으로 데이터를 처리하면서 소프트웨어를 구동합니다.

CPU는 상당히 속도가 빠른 반면, D램은 상대적으로 더딥니다. 처리해야 할 데이터양이 많아지면 ‘병목현상’이 발생할 수밖에 없는 구조입니다. 고성능·고효율의 AI 시스템을 구축하려면 기존 D램과 CPU만으로는 한계가 있을 수밖에 없습니다. 더구나 기존 컴퓨터만으로는 대량의 데이터를 동시에 처리해야 할 AI를 구동하기가 어렵죠.

이 문제를 해결하기 위해서 만든 특별한 프로세서가 지능형 반도체입니다. AI를 구동하는 반도체라고 해서 ‘AI반도체’라고 부르기도 하죠. AI반도체는 대규모 연산을 높은 성능, 전력효율로 실행할 수 있습니다.

처음에는 AI반도체 역할을 GPU가 했습니다. 원래 GPU는 그래픽 처리를 위해 개발됐습니다. 3D 등 화려한 그래픽이 담긴 게임을 하려면 고성능 GPU를 장착해야 하죠. GPU는 여려 명령을 동시에 처리하는 병렬 구조 덕분에 AI알고리즘 처리에 유리했습니다. 한번에 여러 개 붓을 갖고 그림을 그리는 것으로 상상하시면 됩니다. 일반 CPU는 한가지 작업을 마친 후 다음 작업을 처리하는 직렬방식에 최적화된 것과 차이가 있죠. 2010년 AI 분야 석학인 앤드루 응 스탠퍼드대 교수는 12개의 GPU가 무려 2000개의 CPU에 맞먹는 딥 러닝(기계학습) 성능을 발휘한다는 사실을 발견하면서 GPU는 AI혁명의 총아로 주목받기 시작했습니다.

AI서비스를 강화하는 글로벌 IT기업들이 GPU를 데이터센터에 장착하기 시작했습니다. GPU시장의 주요 플레이어는 미국의 엔비디아(NVIDIA)사입니다. 엔비디아는 AI뿐만 아니라 암호화폐 채굴에 뛰어난 성능을 보유했다는 이유로 지난해 1월 이후 현재 주가가 4배가량 치솟았습니다. AI반도체에 대한 시장의 기대감을 보여주는 대목입니다.

이제는 GPU의 병렬처리 특성을 활용하되 AI만을 위한 전용 지능형 반도체가 등장하고 있습니다. GPU가 본래 AI연산을 위해 만들어진 반도체가 아니기에 이를 전담하는 새로운 반도체 개발이 이뤄지고 있습니다. 전통적 반도체 기업인 퀄컴, 인텔, 삼성전자뿐만 아니라 소위 ‘GAFA’로 불리는 구글, 아마존, 페이스북, 애플도 AI반도체 개발에 뛰어들고 있습니다. 선도적으로 자율주행차 개발에 나서고 있는 테슬라도 AI반도체를 개발하고 있습니다.



글로벌 IT 빅플레이어들이 꿈꾸는 것은 이른바 ‘AI의 수직계열화’입니다. AI 관련 하드웨어, 소프트웨어, 서비스 등을 모두 통합해서 만들겠다는 겁니다.

자신들의 시스템에 최적화된 칩을 개발하는 방향으로 사업을 확장하는 셈입니다. 각 분야 산업에 활용되는 AI 비중이 엄청나게 커지다 보니 AI 반도체를 외부에 의존하는 것보다 직접 개발하는 것이 더 효율적이라고 판단한 것입니다. 난공불락으로 보였던 모바일 AP, CPU 분야의 강자들은 바짝 긴장하고 있는 상황입니다.

현재 구글의 업그레이된 ‘알파고 제로’는 지능형 반도체인 TPU(Tensor Processor Unit) 4개만을 사용합니다. 성능이 크게 향상된 것은 물론 전력 효율 면에서도 기존 알파고보다 30~80배 수준으로 좋아졌습니다. TPU는 데이터분석·딥러닝용으로 구글이 자체 개발한 반도체 칩으로 신경망 처리장치(NPU)의 일종입니다. 학습 데이터를 단시간에 받아들이고 처리하고 적용할 수 있어, AI반도체의 한 부류로 거론됩니다.

테슬라는 전기차를 만들고, 거기에 자체 자율주행 소프트웨어를 얹어 자동차를 만들고 있습니다. 반도체 전문 제조업체가 아니다 보니 처음엔 자율주행 구현을 위해 필요한 AI 반도체를 외부업체에 의존했습니다. 그러다 지난 2019년 4월 자체 설계한 자율주행용 AI반도체를 공개했습니다.

일론 머스크 테슬라 최고경영자(CEO)는 “지금까지 칩을 설계해 본 적 없는 테슬라가 세계 최고의 칩을 설계한다는 건 처음엔 있을 수 없는 일이라고 생각했다”며 “그런데 그 일이 벌어졌다. 지금부터 생산되는 테슬라 차는 새로운 칩을 탑재하게 된다. 자율주행 기술을 획기적으로 끌어올렸다. 다른 칩보다 월등히 뛰어나다”고 자신감을 내비쳤습니다. 테슬라는 최근 AI를 활용한 로봇 사업에 뛰어들겠다고 선언하면서 자체칩 개발에 더욱 공을 들일 전망입니다.

이동통신사인 SK텔레콤도 지난해 국내 최초로 데이터센터용 AI반도체를 출시했습니다. 자체 개발한 데이터센터용 AI반도체 ‘사피온 엑스220’(SAPEON X220)은 SK텔레콤이 핵심설계를 하고 SK하이닉스와 협업했습니다. 사피온 엑스220은 현재 데이터센터에서 주로 사용하고 있는 GPU와 견줘 딥러닝 연산 속도가 1.5배 빠르고 전력 사용량은 80%에 불과하며 가격은 절반 수준이라고 합니다. SK텔레콤은 개발된 기술을 자사 클라우드 데이터센터 등에 적용해 서버용 AI 반도체를 국산화하고, 향후 전 세계 반도체 시장에도 진출할 계획입니다.

GPU 최강자 엔비디아도 가만히 있는 건 아닙니다. 세계 최대 팹리스인 ARM을 400억달러(한화 약 45조원)에 인수하며 AI 반도체 영토를 확장하고 있습니다. 1990년 영국에서 설립한 ARM은 삼성전자·애플·퀄컴 등 세계 1000여개 기업에 반도체 기본 설계도를 만들어 제공하고 사용료(로열티)를 받고 있습니다. 통상 반도체 설계디자인 회사를 팹리스(fabless)로 불리는데, 대부분 팹리스는 ARM의 기본 설계를 바탕으로 자사의 기술을 더해 최종 설계도를 만듭니다. ARM이 ‘팹리스계의 팹리스’라고 불리는 이유죠.

인텔의 ARM 인수로 반도체 설계분야에서 ‘수직계열화’가 생기면 후발주자들에게 불리할 가능성이 있습니다. ARM의 고객인 엔비디아가 ARM의 ‘게이트 키퍼’ 역할을 할 수 있다는 우려 때문입니다. 로열티 가격을 인상하거나 연구개발(R&D)을 엔비디아에 유리하게 끌고 갈 여지도 있습니다. ARM은 그간 중립적 위치에서 삼성전자, 퀄컴에 설계를 팔았지만 이젠 ‘중립성’이 훼손될 우려가 커진 셈이죠. 미국 내 빅테크인 아마존, 테슬라 등이 이번 M&A에 반대에 나서고 있는 것도 이런 이유 때문입니다. AI반도체 시장 선점을 위해 글로벌 플레이어들이 벌이는 총성 없는 전쟁에서 승자는 누가 될까요.