사피온, AII 반도체 ‘X330’ 출시…엔비디아 L40S GPU와 경쟁 예정
by김현아 기자
2023.11.16 13:00:00
TSMC의 7나노공정을 통해 생산
기존 제품보다 4배 빨라진 AI 추론 성능
시제품 테스트와 고객사와 신뢰성 검증 진행
내년 상반기부터 양산
[이데일리 김현아 기자]
| Our best-ever AI Accelerator, SAPEON X330 |
|
| 사피온 마이클 쉐바노우(Michael C. Shebanow) 최고기술책임자(CTO) |
|
SK그룹이 투자한 AI 반도체 기업인 사피온(SAPEON, 대표 류수정)이 전작 대비 속도가 4배 향상된 데이터센터 용 AI 반도체 ‘X330’을 출시한다.
X330은 TSMC의 7나노 공정을 통해 제작됐다. 사피온은 주요 고객사들을 대상으로 X330 시제품 테스트와 고객사들과의 신뢰성 검증 작업을 거친 후 내년 상반기부터 양산을 시작할 예정이다.
X330은 향상된 성능 및 전력효율을 제공해 거대언어모델(LLM) 지원을 추가했다. 이를 통해 전반적인 총소유비용(TCO)을 개선하며, AI 서비스 모델 개발 기업 및 데이터 센터 시장을 공략할 계획이다.
X330반도체 하드웨어와 함께 서버 장착 시 성능을 최적화할 수 있는 Open Neural Network Exchange (ONNX) 기반의 소프트웨어 스택(Software Stack)을 지원하며, AI 추론 플랫폼 소프트웨어와 소프트웨어 개발도구(SDK)도 함께 제공한다.
X330은 추론용 신경망처리장치(NPU)로서 전작인 X220에 비해 응용 범위가 표준 기술 기반에서 대폭 확대돼 다양한 분야와 산업군에서 손쉽게 활용할 수 있는 NPU로 평가된다.
우선 기존 X220 대비 4배 이상의 연산 성능과 2배 이상의 전력효율을 확보했다. 이는 2023년 출시된 동급 5나노미터(nm) 제품 대비 연산 성능이 약 2배, 전력 효율이 1.3배 이상 우수한 수준임을 나타낸다고 회사 측은 설명했다.
더불어, X330은 동영상 관련 프로그램의 처리속도 향상을 위해 비디오 코덱 및 비디오 후처리 IP를 내장하고 있다. 내장된 하드웨어 IP를 통해 4채널 4K 60fps 동영상 입력 처리가 가능합니다.
기존 사피온 X220은 국내 최초로 고성능 AI 언어 모델 ‘BERT’ 추론에서 우수한 성능을 보였고, 새로운 X330은 대화형 AI ‘챗GPT’의 원천기술인 ‘트랜스포머’ 기반 LLM 실행을 달성했다.
류수정 대표는 X330이 엔비디아의 L40S 그래픽처리장치(GPU)를 대체할 수 있다고 설명했다. L40S 기반 서버는 델 테크놀로지스(Dell Technologies), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise), 레노버(Lenovo) 등을 통해 출시됐다. 엔터프라이즈용 생성형 AI 가속화에 쓰인다.
사피온은 이러한 성능과 기술력을 기반으로 SK텔레콤과 협력을 강화해 신규 서비스 시장을 공략하고 있다.
지난해 12월에 SK브로드밴드 가산 데이터센터(IDC) 내에 사피온 AI 반도체 X220 장착 서버를 사용하여 대규모 NPU Farm을 구축했고, 이미지 분석, 자연어 처리, 화질 개선 등 다양한 분야에서의 상용화 테스트를 성공적으로 수행하며 비즈니스 모델 확대 가능성을 확인했다. 또한 사피온은 NHN클라우드의 데이터센터뿐 아니라, 슈퍼마이크로와 델 같은 서버 업체와도 공급을 논의하고 있다,
류수정 사피온 대표는 “사피온은 X220의 장점을 극대화한 X330으로 AI 서비스 모델 개발 기업 및 데이터 센터 시장 공략에 박차를 가할 전략이다. 또한, AI 반도체를 활용하여 다양한 분야에서의 서비스를 제공하며 고도의 AI 기술을 누구나 저렴하게 이용할 수 있게 함으로써, 첨단 기술 발전의 혜택을 모두가 누릴 수 있는 사회를 만들기 위해 노력하고 있다”라고 말했다.