|
KT의 IPTV 서비스망 및 음성전화 및 문자 서비스망은 인터넷 서비스 망과 별도로 구성돼 있으나, 이번 사고에서 일부 장애가 있었던 것으로 나타났다.
음성전화·문자 서비스망은 인터넷 서비스 장애로 인해 전화와 문자 이용이 늘었고, 단말전원을 리셋한 이용자로 인한 트래픽 증가가 발생해 부하가 가중됐을 것으로 사고조사반은 추정했다. 단말전원 리셋 시 단말이 망에 다시 등록하므로 추가적인 트래픽이 발생할 수 있다.
과학기술정보통신부(장관 임혜숙) 사고조사반은 29일 이 같은 내용의 이번 사고 조사 결과를 발표했다.
야간이 아닌 주간에 수행
조사반은 이번 사고 조사·분석 과정에서 다음과 같은 KT의 관리적·기술적 문제점이 있었다고 파악했다.
관리적 문제점으로는 당초 KT 네트워크관제센터가 야간작업(01시~06시)을 승인하였으나, 작업이 주간에 수행되는 과정에서 장애가 발생하게 되었던 것으로 확인했다.
망차단 없이 작업하고 명령어 누락 사전 검증 못해
작업관리체계 부실 및 망차단이 되지 않았다. 작업 관리자 없이 KT 협력업체 직원들인 작업자들끼리만 라우팅 작업을 수행하는 등 작업오류를 방지하기 위한 작업관리체계가 부실했으며, 네트워크가 연결된 채로 작업이 이뤄진 것으로 확인했다.
기술적인 문제점으로는 우선 사전검증 단계에서 오류를 파악하지 못했다.
라우팅 작업계획서상의 라우팅 설정 명령어 스크립트에서 IS~IS 프로토콜을 종료하는 ‘exit’ 명령어가 누락됐으나 스크립트 작성과정 및 사전 검증 과정에서 발견하지 못했다.
1, 2차에 걸친 사전검증 단계가 존재했으나, 사람이 직접 검토하는 체계이기 때문에, 오류를 발견하지 못했다.
시뮬레이터 및 오류의 확산 방지 또한, 네트워크가 차단된 가상 상태에서 오류 여부를 사전에 발견하기 위한 가상 테스트베드가 없었고, 지역에서 발생한 오류가 전국으로 확산하는 것을 차단할 수 있는 시스템도 부재했다고 과기정통부 사고조사반은 판단했다.