인텔 서니코브(Sunny Cove)와 AMD 젠2(Zen 2)
[IT벤치마크팀 닥터몰라] (▶
1편에서 계속)한편, 지난해 11월 미국 샌프란시스코에서 개최된 ‘넥스트 호라이즌’(Next Horizon) 행사는 AMD의 새로운 마이크로아키텍처 젠(Zen)2가 단연 주인공이었다. 특히 Zen 2는 TSMC가 생산을 대리하는 첫 번째 AMD 마이크로프로세서이자 x86 역사상 처음으로 7nm 제조공정을 상용화하는 사례가 된다. 양사가 의도했든 의도하지 않았든 2019년은 인텔의 서니코브(Sunny Cove)와 AMD의 젠2가 진검승부를 펼칠 무대가 될 것이다.
앞서 AMD는 2017년에 글로벌파운드리의 14nm 제조공정으로 생산되는 젠을 발표한데 이어 이듬해에는 12nm 공정 기반의 젠플러스(Zen+)를 선보인 바 있다. 그러나 마이크로아키텍처의 측면에서 Zen+는 Zen과 거의 다를 바 없었으며, 금년 상용화될 Zen 2가 2017년 이후 AMD의 역사에서 중요한 이정표가 된다.
| 닥터몰라 제공 |
|
Zen 2의 가장 큰 특징은 클럭당 부동소수점 연산 처리량이 기존 Zen / Zen+ 대비 2배로 오른 것이다. 기존 Zen 계통의 마이크로아키텍처는 128bit SSE 명령어에 대응하는 처리장치를 2유닛 탑재하고 있었다. 2011년 이후 상용화된 256bit AVX 명령어를 실행하기 위해서는 내부적으로 2개의 명령어로 분해해 처리하는 것이 불가피했고, 따라서 AVX 명령어가 적용된 어플리케이션 또는 게임 등에서 최적화된 성능을 발휘할 수 없었다. 반면 Zen 2는 해당 유닛 수를 그대로 유지하되, 256bit AVX 명령어를 그대로 처리할 수 있도록 통로의 너비를 두 배로 넓힌 것이다. 만시지탄이지만 AMD에게도 그간 피치못할 사정이 없지 않았다.
2011년 이후 AMD를 지배한 화두는 CPU와 GPU의 통합이었다. CPU가 처리하기에 버거운 병렬 연산(주로 부동소수점 연산)은 GPU에 이양하고 CPU는 상대적으로 가볍고, 병렬화하기 어려운 연산(주로 정수 연산)에 집중시키는 것이 통합의 이상향이었던 것이다. 그 결과 부동소수점 연산성능을 대폭 희생한 Bulldozer 마이크로아키텍처, CPU와 GPU를 통합한 APU라는 개념 등이 연쇄적으로 등장하게 되었다.
| 닥터몰라 제공 |
|
결과부터 말하자면 이러한 발상의 전환은 성공적이지 못했고, AMD는 다시 과거의 철학으로 회귀한 Zen 계통 마이크로아키텍처를 2017년 선보였으며 이를 더욱 가속화해 Intel 수준의 부동소수점 연산성능을 갖춘 Zen 2를 내놓기에 이른 것이다.
이러한 변화를 가능케 한 것은 단연 7nm 제조공정의 도입에 있다. 14nm 제조공정 대비 약 100%의 밀도 향상을 수반하는 TSMC 7nm 제조공정 하에서 부동소수점 연산 유닛을 대폭 확장하더라도 CPU 전체의 크기를 더욱 축소시킬 수 있던 것이다. AMD에 따르면 기존 세대와 동일한 작동속도를 달성하는 경우 소비전력은 절반 수준으로, 소비전력을 동일 수준으로 맞출 경우 작동속도는 25% 더 향상된다.
| 닥터몰라 제공 |
|
그러나 7nm라는 숫자에 도취되어서는 안 된다. TSMC의 7nm 제조공정은 현 단계에서는 (숫자상 한 세대 이전에 해당하는) Intel의 10nm와 동급이거나 소폭 앞서는 수준으로 평가받는데, 바로 Sunny Cove가 이 10nm 제조공정을 채택하여 등장할 예정이기 때문이다.
AMD는 Zen 계통 마이크로아키텍처 하나를 14nm / 12nm 세대에 걸쳐 1세대 및 2세대 Ryzen 등으로 나눠 출시한 전례가 있는데, 마찬가지로 Zen 2 계통을 초기 단계의 7nm 제조공정과 (이후 무르익을) 극초단파 액침 노광기술(EUV)을 적용한 7nm+ 제조공정에 걸쳐 Zen 2/3으로 파생시킬 것으로 전망되고 있다.
현재로서는 TSMC의 7nm 제조공정은 성숙했다고 보기 어려우며 제조단가 역시 14nm 세대와 비교해 약 2배 가량 비싼 것으로 알려져 있다. Intel보다 가격경쟁력을 앞세우고 있는 AMD로서는 원가부담이 더욱 크게 느껴질 법하다. 이에 AMD는 ‘코어’와 ‘언코어’를 분리해 코어는 7nm 제조공정으로, 언코어는 14nm 하에서 제조하는 전략을 도입했다.
| 닥터몰라 제공 |
|
서버용 CPU EPYC을 예로 들면 Zen 세대에서는 8코어분의 ‘코어’와 ‘언코어’를 올인원화한 제플린(Zeppelin) 다이 4개를 탑재해 총 32코어를 달성하는 방식이었으나, Zen 2 세대에서는 8코어 ‘코어’ 다이 8개와 독립된 ‘언코어’ 다이 1개를 묶어 총 64코어를 달성하게 된다. 복잡도가 늘어나는 단점이 있으나 생산비용이 절감하고, 불필요한 ‘언코어’ 낭비분이 없어지는 장점이 공존한다. 새 전략의 도입이 득이 될지, 독이 될지는 시간이 알려줄 것이다.
▲닥터몰라 소개= 다양한 전공과 배경을 가진 운영진이 하드웨어를 논하는 공간이다. 부품부터 완제품에 이르는 폭 넓은 하드웨어를 벤치마크하는 팀이기도 하다. 데이터베이스를 구축해 이미 알려진 성능의 재확인을 넘어 기존 리뷰보다 한층 더 깊게 나아가 일반적으로 검출하기 어려운 환경에서의 숨은 성능까지 예측가능한 수리모델을 개발하고 있다.
필진으로 이대근 씨(KAIST 수리과학 전공)와 이진협 씨(성균관대학교 생명과학 및 컴퓨터공학 전공), 이주형 씨(백투더맥 리뷰 에디터/Shakr 필드 엔지니어) 등이 참여한다.