[단독]위기에 빛났다…임원들 반대 뚫고 데이터센터 투자 이끈 박원기 대표
by김현아 기자
2022.10.18 15:53:44
박원기 네이버클라우드 대표 인터뷰
2009년부터 네이버 인프라 책임져
자체 센터 ‘각’ 설립 주도
‘각’에 3,000억 이상 들어…이해진 GIO가 공감해줘
이해진, 제2 데이터센터 상량식에 직접 참석
위험을 외부에 맡긴 카카오와 달라
네이버, 재난대비 서비스 설계와 1년에 2회 모의 훈련
[이데일리 김현아 기자]
| 박원기 네이버클라우드 대표. 사진=네이버 제공 |
|
지난 15일 오후 3시 33분 발생한 SK C&C 데이터센터 화재. 지하 3층 배터리실에서 시작된 불은 오후 11시46분 완전진압됐고, 서버실 전원은 자정을 넘겨 차례로 들어오기 시작했다. 과학기술정보통신부에 따르면 사고 발생 나흘째인 18일 오전 9시 기준 전원 공급은 95%가량 이뤄졌다.
카카오의 서비스들은 아직도 완전히 복구되지 못했지만, 네이버는 달랐다. 화재 발생 4시간여 만에 일부 장애가 발생했던 서비스들이 정상화된 것이다. 3만 2,000여 대의 서버를 맡겼던 카카오보다 적은 수이지만, 네이버 역시 2~3만 대의 서버를 SK 판교센터에 두고 전체 트래픽의 10%를 처리하고 있었다. 그런데 어떻게 화재가 진압되기도 전에, 전원 공급이 재개되기도 전에, 서비스를 정상화할 수 있었을까.
박원기 네이버클라우드 대표는 이데일리와의 전화 인터뷰에서 “자가 데이터센터를 짓고, 이중화하고, 서비스 아키텍처 를 개선하고, 인프라의 안정성을 높이는 기술적인 노력을 한 덕분”이라고 했다. 박 대표는 “옆집 슬픈 일이 우리 집에 경사가 되면 안 되지 않느냐”라고 주저했지만, 10년 전부터 데이터센터 인프라 고도화를 고집스럽게 챙긴 그의 이야기가 듣고 싶어 질문을 계속했다.
박원기 대표는 2009년 당시 NHN의 인프라서비스본부장으로 입사해 네이버의 IT인프라 서비스 전반을 책임지기 시작했다. 네이버가 2013년, 국내 IT 기업 가운데 처음으로 자체 데이터센터인 ‘각’을 만들 때, 이를 주도했다. 춘천 구봉산 자락에 만든 ‘각’은 네이버 서비스의 대부분을 담당하고 있다. 네이버는 ‘각’에 이어 두 번째 데이터센터인 ‘각 세종’을 2023년 2월 완공을 목표로 세종시 집현동 산 163번지 도시첨단산업단지에 만들고 있다. ‘각’이 네이버 서비스를 위한 서버 자원관리차원이었다면, ‘각 세종’은 글로벌 클라우드 사업 확장의 전초기지가 될 전망이다. ‘각 세종’은 최소 10만대 이상의 서버를 구축할 수 있어 △빅데이터 △인공지능(AI)△로봇 등 첨단 산업의 컴퓨팅 환경을 대규모로 확장할 것으로 보인다.
10년 전에 자체 데이터센터를 만들자고 했을 때 반대는 없었을까. 애플, 구글, 메타, 아마존, MS 같은 글로벌 빅테크들은 데이터센터, 재난복구 등에 100조 원 넘게 투자한다지만, 덩치가 작은 국내 IT기업으로선 쉽지 않은 결정이다. 네이버가 ‘각’을 지었을 때 땅값을 빼고 3000~4000억 원 정도 들었다고 한다.
그런데 ‘각’에는 이번 화재사고에서 발화가 시작된 화재에 취약한 배터리가 없다. 박 대표는 “각에는 배터리 없이 전기를 공급하는 다이나믹 UPS(무정전전원공급장치)를 썼다”면서 “전원에 장애가 있을 때 발전기가 자동으로 킥오프되는 방식으로 구축했다. 돈은 많이 든다”고 했다.
비용 문제로 데이터센터 건립에 내부 반대는 없었을까. 그는 “뭐 그랬다”면서 “우리 GIO(이해진 글로벌투자책임자)가 굉장히 많이 공감해줬다”고 전했다.
이해진 GIO는 자국 데이터를 보호하겠다는 의지가 남다른 것으로 전해진다. 은둔의 경영자로 꼽히지만, 지난 6월 20일 두번 째 데이터센터 ‘각 세종’ 상량식에 참석해 직원들을 격려했다. 이 GIO는 2019년 한국사회학회·한국경영학회 공동 심포지엄에 참석해 “4차 산업혁명 시대에 데이터를 뺏기는 건 매출을 뺏기는 것과 같다”고 힘줘 말하기도 했다.
자체 센터 ‘각’을 메인센터로 해서 6개 데이터센터에 데이터를 분산한 덕분에, 네이버는 데이터센터 화재라는 큰 위기를 넘길 수 있었다. 반면, 카카오는 남의 데이터센터를 메인센터로 빌려 쓰는 바람에 기본적인 위험을 SK에 의존한 셈이 됐다.
박원기 대표는 데이터 보호와 재난대비를 위해 제일 중요한 것은 따로 있다고 했다. 그는 “서비스 로직과 비즈니스 로직을 분산해 제공할 수 있도록 하는 서비스 아키텍처(설계)가 중요하다”면서 “이런 상황이 발생했을 때 여러 센터에서 서비스를 제공할 수 있어야 한다는 의미”라고 했다.
이 같은 재난대비 운영 기술과 경험을 쌓기 위해 네이버는 BCP(Business Continuity Plan, 업무연속성계획)를 만들어 모의훈련을 한다고 했다. 박 대표는 “가뭄이든, 화재든, 전쟁이든, 팬데믹으로 사람이 운영하기 어려운 상황이든 시나리오별로 BCP를 만들어 1년에 두 번씩 실제 모의 훈련을 한다”고 전했다.