X

Only Edaily “엔비디아 안 부럽다”... 베일 벗은 토종 AI 칩, 초거대 모델 한 장으로 돌렸다

이 기사 AI가 핵심만 딱!
애니메이션 이미지
김현아 기자I 2026.06.07 15:25:20

국산 AI반도체 성능지표 (K-Perf) 검증 결과
괴물 칩의 등장… 리벨리온 ‘R100’
1200억 개 매개변수 모델, 단일 칩으로 소화
뭉치면 더 무섭다… 퓨리오사AI '레니게이드'
'멀티카드’ 무한 확장성
국산 AI칩 서로 다른 경쟁력 확인

[이데일리 김현아 기자] 국내 AI 반도체 성능을 검증하는 한국형 AI 벤치마크 ‘K-Perf’ 시범 평가에서 리벨리온과 퓨리오사AI가 각기 다른 강점을 드러냈다. 퓨리오사AI가 멀티카드 기반 확장성을 입증했다면, 리벨리온은 단일 칩만으로 초거대 언어모델을 구동하며 높은 추론 성능을 보여줬다는 평가다.

과학기술정보통신부와 한국정보통신기술협회(TTA), 정보통신기획평‘가원(IITP)이 진행한 K-Perf는 AI 챗봇, 문서 검색, 보고서 생성 등 실제 서비스 환경을 기반으로 하는 국산 AI 반도체 성능지표다.

[이데일리 김일환 기자]
리벨리온, 단일 칩으로 1200억개 규모 AI 모델 구동

7일 이데일리가 취재를 통해 확인한 시범 검증 그래프를 분석한 결과 양사 제품은 서로 다른 전략과 강점을 보여준 것으로 평가된다. 정부는 이번 검증에서 리벨리온 ’R100‘과 퓨리오사AI ’레니게이드‘ 모두 수요기업들이 요구하는 성능 기준(SLO)을 충족했다고 설명했다.

가장 눈길을 끄는 부분은 테스트 조건이다.

퓨리오사AI는 LG AI연구원의 ’엑사원(Exaone) 4.0 32B‘를 8비트 부동소수점(FP8)형식으로 구동했다. 320억 개 파라미터 규모의 중형 모델로, 레니게이드 카드 4장과 8장을 묶은 멀티카드 구성으로 시험에 참여했다.

반면 리벨리온은 오픈AI의 ’GPT-oss-120B‘를 고정밀도 16비트 부동소수점(BF16) 형식으로 구동했다. 모델 규모는 엑사원 32B보다 약 3.75배 큰 1200억 개 파라미터 수준이다. 여기에 연산 부담이 더 큰 BF16 정밀도를 적용했고, 하드웨어 역시 단 1장의 R100 카드만 사용했다. 제품 상태도 양산 전 단계인 엔지니어링 프리뷰였다.

업계에서는 이를 “중형 트럭 여러 대를 연결해 달린 경우와 초대형 트레일러를 단독으로 끈 경우의 차이”로 비유한다.

취재 결과 ’R100‘은 최대 약 7000tok/s(초당 토큰 처리량) 수준의 성능을 기록한 것으로 추정된다. 토큰은 AI가 문장 생성에 사용하는 단어·문장 조각 단위로, 초당 토큰 처리량이 높을수록 응답 속도와 처리 능력이 뛰어나다는 의미다.

이는 퓨리오사AI 레니게이드 4장 구성이 기록한 약 4500tok/s를 웃도는 수치다.

또 사용자 체감 성능을 의미하는 TPS/User(유저당 처리속도)에서도 R100은 160~170TPS 수준까지 확장된 반면, 레니게이드는 60TPS 이하 수준에 머문 것으로 분석됐다.

박성현 리벨리온 대표. 이데일리 DB
리벨리온은 초거대 AI, 퓨리오사AI는 데이터센터 확장성

다만, 업계가 주목하는 이유는 단순한 숫자보다 성능이 나온 조건 때문이다.

리벨리온은 1200억 개 매개변수 규모의 초거대 모델을 BF16 환경에서 단일 칩으로 구동하면서도 높은 처리량을 확보했다. 특히 소프트웨어 최적화가 완료되지 않은 엔지니어링 프리뷰 단계에서 측정된 결과라는 점도 관심을 끈다.

이에 따라 리벨리온 R100은 엔비디아 H100이나 B200 등이 주도하는 초거대 생성형 AI 추론 시장을 겨냥하고 있다는 평가다. HBM3E(고대역폭 메모리)를 탑재한 점 역시 하이엔드 AI 가속기 시장 공략 의지를 보여주는 대목으로 해석된다.

백준호 퓨리오사AI 대표. 이데일리 DB
반면 퓨리오사AI는 확장성에서 강점을 입증했다. 레니게이드는 4장 구성에서 약 4500tok/s, 8장 구성에서 약 9000tok/s 수준으로 처리량이 증가하며 사실상 선형 확장성에 가까운 모습을 보였다. 대규모 데이터센터 환경에서 서버를 증설할 경우 예측 가능한 성능 향상이 가능하다는 의미다.

전문가들은 이번 결과만으로 두 제품의 절대적 우열을 판단하는 것은 무리라고 지적한다. 사용된 모델 규모와 정밀도, 카드 수, 태스크 수가 모두 달라 직접 비교에는 한계가 있기 때문이다.

그럼에도 이번 시범 검증은 리벨리온이 단일 칩 기반의 초거대 AI 추론 역량을, 퓨리오사AI가 멀티카드 확장성과 운영 효율성을 각각 입증한 사례로 평가된다.

업계 관계자는 “이번 시범 검증에서 가장 눈에 띄는 부분은 리벨리온이 훨씬 무거운 1200억 개 규모 모델을 단일 칩으로 구동하면서도 높은 처리량과 응답 속도를 보여줬다는 점”이라며 “동일 조건 비교는 아니지만 R100의 하드웨어 잠재력이 상당하다는 점은 분명히 확인된 결과”라고 말했다.

배경훈 부총리 겸 과학기술정보통신부 장관은 “국산 AI 반도체는 글로벌 AI 3대 강국(G3) 도약과 대한민국의 독자적인 AI 경쟁력 확보를 위한 핵심 기반”이라며 “국산 NPU가 글로벌 시장에서 실질적인 비즈니스 성과를 낼 수 있도록 적극 지원하겠다”고 밝혔다.

이 기사 AI가 핵심만 딱!
애니메이션 이미지

주요 뉴스

ⓒ종합 경제정보 미디어 이데일리 - 상업적 무단전재 & 재배포 금지