카카오톡 화재 한 번에 속수무책 8시간반 넘겨…”12년 역사 최장 장애”

카톡먹통

SK C&C 데이터센터 화재로 15일 낮에 시작된 카카오 메신저 애플리케이션 카카오톡 ‘먹통’ 사태가 아예 날을 넘기면서 카카오톡 12년 역사상 가장 긴 시간 이어진 장애로 남게 됐다.

한국시간 오후 3시 30분께부터 카카오톡과 포털 사이트 ‘다음’을 비롯한 다수 카카오 서비스에서 16일 0시 현재까지 8시간 30분을 넘겨 오류가 이어지고 있다. 카카오가 입주한 데이터센터에 난 불로 서버 서비스 전원이 차단되면서다. 함께 입주한 네이버에도 일부 서비스 장애가 발생했다가 대부분 복구됐다.

정보기술(IT) 업계에 따르면 카카오톡이 출시된 2010년 이후 국내에서 수십 차례의 길고 짧은 장애가 발생했으나, 이렇게 장기간 오류가 계속된 적은 없다고 한다. IT 업계 관계자는 “이렇게 카톡 장애가 오래간 건 처음”이라고 말했다.

지금까지 가장 길게 발생했던 장애는 2021년 3월 23일 구글 안드로이드 스마트폰에서 앱 실행이 중단되는 오류로 카카오톡과 네이버 앱을 포함한 특정 앱의 작동이 약 7시간 동안 멈춘 사례였다.
당시 사태는 카카오 내부 문제가 아닌 구글의 ‘안드로이드 시스템 웹뷰’가 업데이트되면서 기존 앱과 충돌한 데 따른 장애로 분석됐고, 안드로이드폰 사용자만 불편을 겪었던 문제였다.

해외 사례까지 보면 중국에서는 2014년 7월부터 8월 말까지 두 달 가까이 카카오톡과 네이버 메신저 라인이 작동하지 않은 적이 있다.

그러나 이 역시 중국 정부가 이들 메신저가 “테러 정보의 유통수단으로 활용되고 있다”며 중국 내 접속을 차단한 데 따른 것으로 두 업체의 문제는 아니었다.

이날 카카오톡 중단 사태는 SK C&C 데이터센터에 전원 공급이 재개되면 2시간 후 정도 지나 비로소 종료될 것으로 예상된다고 카카오 측은 전했다.

과학기술정보통신부는 이날 홍진배 네트워크정책실장이 이끄는 ‘방송통신재난대응상황실’을 중심으로 행정안전부와 소방당국 등 관계 기관 및 SK C&C, 카카오, 네이버 등 장애 발생 사업자와 함께 밤샘 복구를 이어나갈 계획이다.

카카오 관계자는 연합뉴스와 통화에서 “전원 공급 재개 시 2시간 안에 카카오톡을 포함한 전체 서비스가 복구될 것”이라고 말했다.

화재 한 번에 속수무책…’먹통’ 카카오 백업시스템 부실 논란

“이른바 ‘국민 메신저’인데 화재 한 번으로 몇 시간 동안 먹통이 되다니….”

15일 오후부터 수 시간째 카카오톡을 비롯한 카카오[035720]의 각종 서비스가 전혀 안 되자 이용자들은 서비스 운영사인 카카오의 유사시 백업 시스템이 제대로 작동되지 않은 것 아니냐는 지적을 하고 있다.

카카오톡, 카카오페이, 카카오T 등이 장애가 생긴 기본적 원인은 서버가 자리한 SK 주식회사 C&C 데이터센터의 SK 판교 캠퍼스 화재이긴 하지만, 서비스가 오랫동안 재개되지 않아 카카오의 ‘DR'(재난 복구를 뜻하는 데이터 보안 용어) 대응에 문제가 있는 것 아니냐는 의구심이 나온다.

특히 이날 화재가 발생한 같은 건물에 서버를 둔 네이버의 경우 서비스 장애가 카카오만큼 전방위적으로 일어나지 않았고, 일부는 빨리 복구됐다는 점에서 카카오 측 대응에 대한 시민들의 불만이 상당하다. 네이버는 메인 서비스 서버를 춘천에 자리한 자체 데이터센터에 두고 있고, 일부 서비스 서버는 판교 등에 분산한 것으로 알려졌다.

더욱이 카카오톡의 서비스 오류가 잦다는 점도 카카오 측이 근본적인 대응이나 개선책을 내놓지 않은 채 미봉책으로만 일관한 게 아니냐는 비판을 불렀다.

메신저 앱을 앞세워 스타트업에서 전방위로 사업을 확장하며 ‘공룡’ 대기업으로 덩치를 급속히 불렸지만, 그에 걸맞은 책임은 방기하고 있다는 지적도 피할 수 없다.

앞서 카카오톡은 11일 전인 지난 4일에도 20분 가까이 장애가 났고, 심지어 출시 10주년을 딱 하루 앞둔 지난 2020년 3월 17일에도 30여 분간 서비스 장애가 발생한 바 있다.

네티즌 아이디 ‘jumm****’는 “화재에 대응할 준비가 전혀 안 됐었다는 것인지. 카카오에서 지금까지 만약의 대비를 전혀 안 했다면 이실직고하시고 대안을 제시하시라”라고 말했다.

아이디 ‘hkki****’는 “완전한 커플링과 라우팅하여 서버를 우회하는 기능은 당연히 해야 했고, 백업 및 스토리지 분산도 해야 했다. 물론 했겠지만, 비상 기능 수행이 안 된 건 문제”라고 꼬집었다.

이에 대해 카카오는 “인터넷데이터센터(IDC) 하나가 모두 영향을 받은 상황”이라면서 “(데이터 복제) 이중화 작업은 돼 있지만, 데이터가 많다 보니 (복구에) 시간이 걸리는 것 같다”고 해명했다.

<(c) 연합뉴스 협약>

제보는 카카오톡 haninpost 무단 전재-재배포 <금지>