[닥터몰라의 IT이야기]아이맥 프로에 대한 오해와 진실①

by이재운 기자
2018.03.10 00:35:26

'워크스테이션의 가치' 살펴보기

애플 제공
[IT벤치마크팀 닥터몰라] 2013년, 애플은 한동안 업데이트가 없던 맥 프로 라인업에 충격적인 변화를 주었다. 새로 공개된 맥 프로는 이전까지의 데스크톱 컴퓨터와는 판이하게 달랐다. 게다가 이 제품은 소비자를 대상으로 하는 제품이 아니라 전문가를 대상으로 하는 워크스테이션이었기에 시장에 던져진 충격은 더 컸다.

이 제품은 디자인을 포함해 여러 면에서 파격적이라고 하기에 모자람이 없었다. 기본 사양에서부터 2개의 파이오프로(FirePro) 분리형 그래픽을 탑재했다. 지금도 그렇지만 그래픽 연산 유닛을 이용한 범용 컴퓨팅(이하 GPGPU)이 떠오르던 당시에 걸맞는 선택이라 할 만했다. 게다가 이런 강력한 컴퓨팅 파워를 지탱하는 팬은 단 하나 뿐이었다. 하지만 아쉽게도 이 모든 파격의 조합은 그리 큰 성공을 거두지는 못했다. 2013년 이후 다시 맥 프로 라인업은 조용했으며, 많은 사람들은 맥 프로 라인업의 단종까지도 점쳐보고 있었다.

애플 제공
아이맥 프로는 이런 분위기 속에서 혜성같이 등장했고, 많은 이의 주목을 끌었다. 아이맥 프로는 프로용 워크스테이션으로는 다시 한 번 파격적인 디자인을 채택했다. 이름에서부터 알 수 있듯이 아이맥 프로는 컨슈머용 아이맥과 디자인이 매우 흡사하다. 외관에서 오는 가장 큰 차이는 알루미늄의 원색에 가까운 컨슈머용 아이맥과 달리 스페이스 그레이 외관이라는 것이고, 조금 더 자세히 들여다보자면 더 많은 열을 배출할 수 있도록 재설계된 쿨링 시스템에 따라 생긴 소소한 외관 변화 정도이다.

그리고 이런 아이맥 프로의 디자인과 프로용 데스크톱을 홈페이지 전면에 내거는 애플의 홍보 전략, 그리고 630만원부터 시작한다는 높은 절대 가격의 조합은 오해를 낳기에 충분했다. 사람들의 오해를 한 문장으로 정리하자면 ‘누가 630만원을 주고 컴퓨터를 사냐’ 정도가 될 것이다.

하지만 이런 오해는 비즈니스 대상 시장의 특성을 잘 모르기 때문에 일어나는 것이다. 비즈니스 사용자에게 필요한 작업을 잘 해낼 수 있는 컴퓨터가 있다면 기업 입장에서 적어도 2년 이상 사용할 수 있는 도구에 630만원에서 1600만원을 쓰는 것은 ‘별 것 아닌’ 지출일 수 있다. 아이맥 프로는 그 성능이나 특성, 가격 모든 면에서 컨슈머용 제품이 아니라는 것은 분명하다.

즉, 우리가 아이맥 프로를 평가할 때는 전통적인 컨슈머 컴퓨터를 평가하는 방식에서 탈피해서 아이맥 프로가 비즈니스 사용자들의 사용 패턴에서 자신의 일을 얼마나 잘 해낼 수 있는지에 집중해야 한다. 이번 글에서는 아이맥 프로 자체의 하드웨어에 대한 분석과 함께 아이맥 프로가 어떤 비즈니스 환경에서 사용되게 될지, 그리고 여기에 대한 간략한 분석을 다룰 것이다. 이 글에서 제시된 비즈니스 환경들을 구축하고, 여기에 대한 벤치마크는 이후에 있을 테크니컬 리뷰에서 다루도록 하겠다. 그럼 지금부터 아이맥 프로의 하드웨어를 톺아보자.

애플 제공
아이맥 프로는 그 이름에 걸맞게 CPU, 메인 메모리, 그래픽 연산 유닛 모두 전문가용 제품을 사용했다. CPU의 경우 인텔의 제온 W 프로세서를 사용했는데, 제온 W 프로세서는 스카이레이크-XSP 아키텍처를 기반으로 한 1소켓 워크스테이션용 프로세서이다. 스카이레이크-XSP 아키텍처는 일반 사용자용 스카이레이크 아키텍처와는 꽤 차이가 있는데, 512비트 부동소수점 벡터 연산 명령어 세트(AVX-512)를 하드웨어적으로 지원하여 해당 명령어셋을 잘 활용한 프로그램에서의 부동소수점 연산 처리량을 큰 폭으로 끌어올렸고, 상대적으로 L2 캐시의 용량을 확장시키고 L3 캐시의 용량을 줄이고 이 둘 사이의 관계를 바꾸는 등의 수정 역시 존재한다.

이런 아키텍처적인 차이 이외에도 제온 W 프로세서는 쿼드 채널 메모리를 지원하기 때문에, 일반 소비자용 CPU에 비해 더 넓은 메모리 대역폭을 확보할 수 있다.

인텔 제공
물론 이런 아키텍처적인 변화도 있지만 가장 근본적인 성능 차이는 많은 코어 개수에서 나온다. 최근 GPGPU가 떠오르고 거의 모든 연산을 CPU가 수행하던 과거와는 컴퓨팅 환경이 달라졌다고는 하지만 여전히 일부 병렬화하기 쉽고 간단한 연산을 제외한 일반적인 프로그램에서 대부분의 연산은 CPU의 몫이다.

그리고 CPU의 코어가 늘어나는 것은, 작업 분배가 제대로 되기만 한다면 가장 확실한 성능 향상의 길이다. 아이맥 프로는 기본형 모델에서부터 8코어를 제공하고, 커스텀 옵션으로 10코어, 14코어 18코어에 이르는 선택지를 제공한다. 요구하는 연산량이 적고 상대적으로 매우 많은 연산을 요구하는 전문가 작업들에 있어서 이런 차이점들은 매우 중요할 수 있다.

아이맥 프로의 메인 메모리 역시 일반 사용자용 컴퓨터에 들어가는 것과는 다르다. 컴퓨터는 메인 메모리에 프로그램 코드, 데이터 등이 저장되고 CPU는 이 메인 메모리에서 코드와 데이터를 읽어 연산을 수행하고 그 결과를 다시 메모리에 쓰는 방식으로 실행된다. 즉, 메인 메모리는 컴퓨터 구동에 부차적인 요소가 아닌 핵심적인 요소이다.

그런데 흔히 메인 메모리로 사용되는 D램(DRAM)은 드물게 외부의 전자기적 영향에 의해 내부에 저장된 상태가 뒤바뀌는 일이 일어난다. 이런 일이 벌어진다면 뒤바뀐 메모리의 위치에 따라 해당하는 프로세스가 죽거나, 전체 시스템이 다운될 수 있다. 물론 유효한 데이터 영역이 아닌 곳에서 이런 일이 벌어졌을 경우 아무 일 없이 넘어갈 수도 있다. 따라서 이 문제는 일반 사용자들의 컴퓨터 사용 패턴에서는 그렇게 심각한 일이 아니다. 이런 문제가 발생하는 빈도가 높지 않은데다가 발생하더라도 최악의 경우 PC를 재부팅하면 그만이다.

하지만 수십시간, 심하면 몇 주간 특정 값을 계산해내거나, 신경망을 학습시키거나, 3D 렌더링을 수행하는 워크스테이션에서 이런 문제가 발생하면 이는 즉시 작업 결과의 심각한 손해로 이어진다. 따라서 이런 문제를 해결할 수 있는 방법이 필요하다.

아이맥 프로와 워크스테이션들에 탑재되는 ECC 메모리(Error Correcting Code Memory)는 메모리에 데이터를 저장하는 비트 외에 에러 검출과 수정을 위한 추가 비트를 할당하고, 이 추가 비트를 이용해 실시간으로 에러를 검출하고 수정할 수 있는 메모리 컨트롤러에 의해 작동된다. ECC 메모리는 컴퓨터 시스템이 작동하는 중 일부 비트에 에러가 발생해도 이를 하드웨어를 이용해 실시간으로 검출하고 수정함으로써 이 문제를 해결한다.

당연히 메모리에 데이터를 담지 않는 추가적인 공간이 있고 특수한 컨트롤러 역시 필요하기 때문에 수요 자체도 적고, 최종적으로 가격은 비쌀 수밖에 없다. 그럼에도 불구하고 메모리 에러로 인한 피해가 큰 전문가 작업에서는 여전히 ECC 메모리가 요구된다.

AMD 제공
라데온 프로 베가 역시 일반 소비자들이 사용하는 그래픽 유닛에 주어진 임무와는 다른 임무를 맡고 있다. 일반 소비자들 중 대부분은 그래픽 유닛의 성능에 크게 신경을 쓰지 않는다. 대부분의 CPU 내장 그래픽 유닛으로도 간단한 사무나 GUI 등을 처리하기에는 충분한 정도의 성능을 내기 때문이다.



만약 일반 소비자들 중에 강력한 그래픽 성능을 요구하는 사용자층이 있다면, 이들은 십중팔구 게이머일 것이다. 최신 3d 게임들은 강력한 그래픽 연산 성능을 요구하며, 게이머들은 이런 게임을 더 높은 품질로 쾌적하게 즐기기 위해 강력한 그래픽 카드를 구매한다. 하지만 아이맥 프로의 그래픽 유닛은 이런 게이머들을 위한 그래픽 유닛이 아니라 GPGPU를 훌륭하게 수행할 수 있는 칩으로써의 가치가 더 크다.

실제로 최근 몇 세대 동안 AMD의 그래픽 유닛은 같은 세대의 엔비디아(NVIDIA) 지포스 그래픽 유닛에 비해 상대적으로 그래픽 성능보다는 계산 성능 쪽에서 장점을 보여왔다. 암호화폐로 인해 그래픽 유닛이 품귀현상을 보일때 라데온 그래픽카드의 품귀가 심했던 것 역시 같은 맥락에서 이해할 수 있다.

이런 그래픽 유닛의 특성에 더해, 애플의 새 그래픽 API인 메탈(Metal)이 상대적으로 AMD 그래픽 유닛에 최적화되어 있기 때문에 아이맥 프로 역시 AMD의 그래픽 유닛을 채택했다. 아이맥 프로가 채택한 그래픽 유닛은 라데온 프로 베가 시리즈로, 기본형에는 56개의 CU(Compute Unit)을 가진 라데온 프로 베가 56이 들어가고 이는 라데온 프로 베가 64로 업그레이드 될 수 있다. 베가 56과 64는 각각 8GB, 16GB의 HBM2 메모리를 탑재하여 넓은 대역폭을 제공한다. 아이맥 프로에 들어가는 라데온 프로 베가는 프로용 그래픽카드가 제공하는 기능들을 제공한다.

맥OS 상에서는 사실 프로용 그래픽카드가 제공하는 기능들이 별도로 분리되어있지 않지만, 부트캠프를 통해 윈도우즈를 설치할 경우 라데온 프로를 위한 드라이버가 설치된다.

다만 AMD의 그래픽 유닛들은 범용 연산성능이 좋은 것과 별개로, 직접 GPGPU를 사용하는 프로그램을 개발하는 것은 쉽지 않다. 이는 현재 GPGPU를 사용하는 많은 분야의 커뮤니티에서 널리 사용되고 있는 API가 쿠다(CUDA)이기 때문이다. 예를 들어 최근 많은 분야에서 큰 진전을 보여주고 있는 딥 러닝 같은 경우에는, 많은 행렬곱 연산들이 수행되고, 이런 부분에서 GPU는 높은 성능을 보여줄 수 있다. 하지만 딥 러닝 연구자 커뮤니티에서 주로 사용되는 도구들은 대부분 CUDA를 기반으로 동작하기 때문에 AMD 그래픽 유닛의 연산 성능을 효율적으로 사용하기 어렵다.

이 문제는 비단 딥 러닝 분야 뿐만 아니라 CUDA를 활발히 활용하고 있는 많은 분야에서 공통적인 문제이기 때문에 만약 본인의 작업이 CUDA를 통한 GPGPU를 활발히 사용한다면 아이맥 프로보다는 이후에 출시될 ‘모듈형 맥 프로’나 엔비디아 그래픽 카드를 탑재할 수 있는 다른 워크스테이션을 살펴보는 편이 낫다. 물론 썬더볼트 3를 이용해 외장 그래픽 카드를 탑재하는 방식으로 이런 업무에서도 아이맥 프로를 이용할 수는 있겠지만, 여기에 또 추가 비용이 들어간다는 것을 명심해야 한다.

닥터몰라/언더케이지 제공
이처럼 아이맥 프로의 하드웨어들은 워크스테이션 작업을 위해 최적화되어 있다. 물론 일반 사용자들에게는 이 하드웨어들이 단지 비싼 물건들일 것이다. 실제로 18코어에 달하는 제온 프로세서를 일반 사용자들이 사용하더라도 대부분의 경우에 성능 향상을 체감하기 어렵고, 게임 등 싱글 코어 성능을 요구하는 작업에서는 오히려 일반 사용자용 하이엔드 프로세서에 비해 떨어지는 성능을 보일 수도 있다. 높은 연산성능을 가진 그래픽 유닛 역시 일반 사용자들에게 매력적인 제품은 아니다.

일반 사용자들은 높은 최대 연산성능보다는 상대적으로 더 많은 수의 래스터라이저가 포함되어 높은 게임 성능을 보여주는 그래픽 카드를 선호할 것이다. ECC 메모리 역시 일반 사용자들이 그 차이를 느끼기 어려운 부품 중 하나다. 메인 메모리의 값이 외부적인 요인에 의해 변경되어버리는 일은 매우 드물게 일어나는 일이고, 일어났다 하더라도 그 피해는 단순히 귀찮은 정도에 그칠 가능성이 높다. 하지만 이런 하드웨어들은 각각의 성능을 필요로하는 작업들에서는 훌륭하게 자신의 역할을 발휘하여 비싼 가격에 걸맞는 이익을 가져다줄 수 있다.

이미지: 아이픽스잇(ifixit)
일반적으로 컴퓨터에는 메인 프로세서 외에도 많은 칩셋들이 있다. 아이맥 프로는 T2 칩이라는 특기할 만한 칩셋을 포함하고 있다. T2 칩은 일반적으로 컴퓨터에 포함되는 칩들에 비해 더 크고, 여러 가지 기능을 수행한다.

T2 칩은 맥북 프로에 포함되었던 T1 칩의 후속으로도 볼 수 있는데, T1 칩은 그 자체로 ARM 프로세서로, 맥북 프로에서 터치바를 총괄하는 프로세서일 뿐 아니라 터치ID를 위한 보안 공간을 제공하고, 해킹의 위험성이 있는 페이스타임 카메라의 영상에 대한 제어권과 암호화를 담당한다. 동시에 터치바를 포함한 맥북프로에서 핵심적인 기능을 수행했다. 아이맥 프로에서 처음 선보인 T2 칩은 물론 포함되어 있지 않은 터치ID 등을 위한 기능을 수행하지는 않지만 더 강력해지고 폭넓은 기능을 선보인다.

이미지: 아이픽스잇(ifixit)
T2 칩의 가장 핵심적인 기능은 보안에 관련된 기능이다. 일반적으로 SSD의 컨트롤러는 낸드 플래시 메모리와 함께 패키지로 포함되어 있는 경우가 많다. 하지만 T2 칩은 SSD의 컨트롤러를 포함하고 있다. 즉, 아이맥에 연결되는 낸드 플래시 메모리 패키지는 컨트롤러를 포함하지 않은 낸드 플래시 메모리로, 이 자체만을 다른 컴퓨터에 연결할 방법이 있다고 하더라도 이것만으로 이 안에 있는 내용을 읽어내기는 어렵다.

실제로 이런 독특한 방식 때문에 아이맥 프로는 낸드 플래시 메모리 부분을 분리할 수 있도록 설계되어있음에도 불구하고, 사용자가 임의로 용량을 증설하는 등의 업그레이드가 불가능할 것으로 보인다. T2 칩의 SSD 컨트롤러는 자체로 암호화 프로세서를 포함하여 낸드 플레시에 저장되는 내용을 하드웨어적으로 암호화시키고, 운영체제가 해당 내용을 요구하면 이를 복호화시켜 전달하는 동작을 실시간으로 수행한다.

이런 동작은 사용자가 인지하지 못할 정도로 빠르게 일어나는데, 아이맥 프로의 SSD의 순차 읽기 쓰기 성능은 각각 2.8GBs, 3.3GBs로 T2칩에 의한 암, 복호화가 매우 빠르게 일어난다는 것을 확인할 수 있다.

거기에 일반적으로 쓰기 속도보다 읽기 속도가 빠른 낸드 플래시 저장장치의 특성과는 달리 아이맥 프로의 SSD 성능은 순차 읽기 속도보다 순차 쓰기 속도가 더 빠르다는 점에서 아이맥 프로의 SSD 컨트롤러인 T2 칩에 꽤 큰 용량의 버퍼 등이 동작하고 있을 것이라 추측해볼 수 있다.

또 T2 칩에 의한 암호화, 복호화는 운영체제가 수행하는 암호화와는 별개로 동작하는 것이기 때문에 맥OS가 제공하는 여러 단계의 암호화 기능을 이용하면 이중, 삼중의 암호화를 큰 성능 저하 없이 사용할 수 있다. 게다가 이런 하드웨어 암호화가 T2 칩에 의해 이뤄짐으로써 아이맥 프로의 메인 프로세서가 암호화, 복호화에 연산 성능을 할당할 필요가 줄어든다는 점 역시 T2 칩이 제공할 수 있는 강점이다. 또 T2 칩은 보안 부팅 역시 지원하는데, 이는 보안 단계에서 악성 코드를 실행시켜 원치않는 내용을 메모리로 올리는 것을 원천적으로 차단하게 된다.

그 외에도 T2 칩에는 여러 시스템 관리 컨트롤러, 이미지 처리 프로세서, 오디오 컨트롤러들이 포함되어 있다. T2 칩은 T1 칩과 마찬가지로 아이맥 프로의 페이스타임 카메라를 통제해 맥OS 위에서 동작하는(메인 프로세서에서 동작하는) 악성코드가 접근하더라도 페이스타임 카메라의 통제권을 탈취하기 어렵게 만들었으며, 페이스타임 카메라에서 오는 영상 정보를 처리하고 여기에 여러 처리를 통해 좀 더 고품질의 영상을 얻을 수 있도록 한다. ▶2편에 계속
애플 제공