12일 업계에 따르면 글로벌 반도체 및 빅테크 기업들은 AI 반도체 개발에 뛰어들고 있다. 인텔은 최근 AI 학습 및 추론칩 가우디3를 공개했고 마이크로소프트(MS)는 AI 모델 학습과 추론을 위한 칩 마이아 100을, 아마존은 추론칩 인퍼런시아2를 선보였다. ‘AI 지각생’으로 불렸던 애플까지 AI 추론칩 제작에 나섰다.
이는 모두 AI 반도체 시장에서 엔비디아 독주를 막기 위한 시도다. 삼성전자 역시 추론에 특화한 AI 반도체 ‘마하1’을 네이버와 개발하고 있다. 마하1은 엔비디아 그래픽처리장치(GPU)가 적용된 AI 반도체를 대신할 신경망처리장치(NPU) 기반 시스템온칩(SoC) 제품이다.
◇삼성의 AI 무기 ‘마하1’…데이터 압축, 추론 특화
|
그러나 AI가 사용자의 특정 요청에 응답해 연산할 때 활용하는 파라미터 덩어리에는 불필요한 것도 있다. 마하1 NPU는 각 덩어리 중 연산에 필요한 파라미터만 메모리에서 불러오는 방식으로 작동해 데이터를 경량화했다. 이를 ‘프루닝’(Pruning·가지치기)이라고 한다.
양자화 기술도 마하1에 도입했다. 양자화는 정보 표현에 필요한 비트(bit·데이터 최소 단위)를 압축하는 기술이다. 데이터를 경량화하는 동시에, 중요한 데이터에는 가중치를 둬 AI 연산 정확도를 높일 수 있다.
◇HBM 대신 LPDDR 탑재…고객사 가격 부담↓
마하1은 데이터를 경량화하는 만큼 고대역폭메모리(HBM) 대신 저전력(LP) DDR D램을 사용한다. HBM은 범용 D램보다 비싼데 LPDDR D램을 탑재하면 그만큼 가격을 낮출 수 있다. 엔비디아 AI 반도체 H100이 5400만원대인 반면 마하1은 약 500만원으로 예상된다. 고객사로선 마하1이 전기 요금과 AI 반도체 구매가격 부담을 모두 덜 수 있는 선택지가 될 수 있다.
|
김형준 차세대지능형반도체사업단장(서울대 명예교수)은 “HBM을 쓰지 않아 가격을 상당히 낮출 수 있다”며 “네이버 피드백을 받으며 제품 완성도를 높이면 AI 추론 시장에서 존재감을 보일 수 있을 것”이라고 설명했다.
◇빅테크와 연합, 엔비디아 쿠다 대항 SW도 개발
전문가들은 마하1의 성공을 위해 소프트웨어 대응도 필요하다고 봤다. AI 개발 소프트웨어 시장은 엔비디아 개발 프로그램 쿠다가 장악하고 있다. 쿠다는 엔비디아가 지난 2006년 무료로 배포한 개발 도구로, 엔비디아 GPU에서만 동작한다. 현재 400만명의 개발자가 쿠다를 이용하고 있다. 생성형 AI 기폭제가 된 오픈AI의 챗GPT도 쿠다를 활용해 탄생했다.
AI 개발자들, 즉 고객들이 삼성전자 마하1을 선택하려면 쿠다에 맞설 AI 개발 소프트웨어가 있어야 한다는 결론이 나온다. 구글과 인텔, 퀄컴, 삼성전자, ARM 등 주요 기업들이 ‘UXL’(통합 가속 재단)을 구성하고 신규 소프트웨어 프로젝트를 추진하는 것도 이 때문이다.
이종환 상명대 시스템반도체공학과 교수는 “AI 반도체 시장에서 치고 나가려면 하드웨어뿐 아니라 소프트웨어를 동시에 갖춰야 한다”고 강조했다.
유회준 카이스트 AI반도체대학원장은 “지금은 개발자들이 쿠다에 친숙해 엔비디아 독점이 쉽게 깨지진 않을 것”이라며 “삼성전자만의 강점을 부각해 데이터센터 외에 온디바이스AI 등 틈새시장부터 영향력을 키울 필요가 있다”고 제언했다.
|