동향

디지털 블랙아웃 대비한 정부·업계 재발방지 대책 논의 활발


□ 플랫폼 기반 모바일 서비스 장애의 재발방지를 위한 기술·제도 마련



ㅇ 데이터센터 화재로 발생한 카카오 주요 서비스 장애* 사고 이후 관계부처 및 민간 전문가들은 원인 분석과 제도·기술 혁신 및 대응 방안 모색

* 10.15일 오후 3시 30분경 카카오톡 메시지 전송 오류·로그인 실패뿐 아니라 다음 메일, 카카오내비, 카카오T, 카카오게임즈 등 주요 플랫폼 서비스 모두 마비, 10.19일까지 순차 복구하며 정상화

- 과기정통부는 SK C&C 데이터센터 내 배터리실에서 발생한 화재 진압을 위해 전체 전원이 차단됨에 따라 소화설비 적정성과 구역별 전원관리 등 면밀한 조사가 필요하다고 설명

- 아울러 한 개의 데이터센터에서 발생한 사고가 전체 서비스 중단으로 이어지고 복구도 지연되었던 상황을 고려하여 서버 이중화 체계의 적정성 검토가 필요하다고 강조

- 이러한 사고가 반복되지 않도록 향후 관련 제도와 기술을 혁신해 나갈 방안을 구체적으로 제시



1-1.PNG


ㅇ 또한 「국내 부가통신사업자 서비스 안정성 긴급 점검회의」를 개최(10.21)하여 사업자 서버 장애 발생 등 비상 상황에 대비한 보호조치를 긴급 점검

- 국내에서 국민 생활과 밀접한 서비스를 제공하는 주요 부가통신사업자*와 함께 다양한 장애 발생 상황에 대비한 보호조치를 긴급 점검하고 안정적인 서비스 제공 방안 논의

* 구글, 넷플릭스, 메타플랫폼스, 우아한형제들, 당근마켓, 아마존 AWS, GS네오텍

- 참여 사업자는 전력 차단, 화재 등 유사시에 대비한 서버 이중화, 트래픽 분산 등 안정적 서비스 제공을 위한 운영?관리 현황을 공유하고, 향후 이상 징후 조기 발견, 서버 다중화 방안, 이용자 고지방안 등 구체적인 개선방안을 만드는데 적극 협력할 예정

- 정부는 이와 같은 사례가 재발하지 않도록 관련 분야 전문가 등과 문제점을 세밀하게 분석하여 기술·제도적 개선안을 이행하는 데 총력을 다할 방침



□ 국내 기업들은 데이터센터 점검 강화... '비용보다 안전' 우선



ㅇ 카카오 사태를 계기로 비용을 투자해 안정성을 높이는 방향으로 데이터센터 운영 방식을 전환하려는 기업들의 움직임 증가

- 현재 기업의 데이터 운용방식은 크게 3가지(△자체 서버실 운영 △KT·SK C&C 등이 운영하는 대형 데이터센터에 입주 △아마존웹서비스(AWS) 등 클라우드 서비스 활용)로 구분

- 이 중에서 자체 서버실을 운영하는 기업은 재난 상황에 대한 긴장감이 높아지면서 데이터센터 이원화 조치 여부 점검, 재해·장애 대책을 강화해나갈 방침

- 신세계, 롯데 등 외부 데이터센터에 서버를 두고 있는 기업들도 카카오 사태의 근본 원인으로 지목된 ‘정기적 훈련’의 필요성을 절실히 체감

- 데이터센터를 여러 곳에 운영한다고 하더라도 셧다운 상황에서 각 센터 간 데이터를 신속하게 잇는 데 실패하면 제2의 카카오가 될 수 있기 때문

- 쿠팡은 ‘고가용성(HA) 테스트(예기치 못한 상황에서 서버, 네트워크, 프로그램 등이 정상 운영될 수 있는 테스트)’를 이미 하고 있었지만, 카카오 사태 이후 추가로 한 차례 더 진행



ㅇ 또한 주요 데이터센터 긴급점검회의(과기정통부, 10.20)에 참석한 다수의 국내 주요 데이터센터사업자는 비상상황에 대비한 보호조치를 긴급점검하고 안정성 확보방안 논의

※ KT cloud, LGU+, SK브로드밴드, LG CNS, 삼성SDS, 롯데정보통신, 하나금융티아이, 데이터센터연합회, 한국정보통신산업연구원 등

- 참석자들은 전력 차단, 화재 등 유사시에 대비한 전력, 소방설비, 배터리 등 이중화 설비의 운영·관리 현황을 공유

- 향후 화재 징후 조기 발견, 구역별 전원관리 방안 등 위기 상황에 대비한 개선방안을 만드는데 적극 협력을 약속



□ 글로벌 기업의 데이터센터 관리와 운영에 관심 증가



ㅇ 구글·아마존·마이크로소프트 등 대형 테크기업은 막대한 투자를 통해 자체 데이터센터를 보유하고 관리하는 것은 물론 이를 다른 기업에 빌려주면서 수익 창출

- 빅테크 기업이 데이터센터를 다른 기업에 빌려주는 것을 ‘클라우드 서비스’라고 하는데 이들은 이 분야 투자를 늘리며 핵심 분야로 육성

- 시너지 리서치 자료에 따르면 글로벌 클라우드 서비스 시장점유율은 아마존이 약 35%로 가장 높으며 마이크로소프트 약 20%, 구글 약 10% 순



1-2.PNG


ㅇ 이들 기업은 데이터센터를 다른 기업에 빌려주고 수익을 창출하기 때문에 대규모 투자를 통해 화재·재난에 대응한 2, 3중의 안전 체계를 갖추는 데 최선

- 데이터센터에 비상사태가 발생할 경우 즉시 투입되는 인력 구성 △전력 공급이 끊어질 때를 대비한 비상 전력 확보 △재해복구 소요 시간 예측 △해킹 방지 대책 △백업 및 복원 절차 등 세부 계획 수립이 일반화



ㅇ (아마존) ‘가용영역(Availability Zone)’이라고 부르는 데이터센터 연결 시스템 도입

- 가용영역은 최소 3개의 데이터센터가 서로 연결돼 데이터를 실시간으로 주고받으며 서로 간 백업 역할을 하는 것으로 하나의 데이터센터가 예상치 못한 영향으로 장애가 생기면 다른 두 데이터센터가 즉시 서비스를 지원

- 데이터센터는 초고속 고성능 네트워크 기반으로 연결되어 있어 서비스 단절 등 고객 피해를 최소화

※ 아마존은 서울에 가용영역 4개를 갖추고 서로 연동



ㅇ (마이크로소프트) 세계 140개국에 분산된 데이터센터를 60여개 리전*으로 관리. 우리나라에도 서울·부산에 데이터센터를 각각 두고, 서로 백업 역할 담당하여 비상 시 상호 대체가 가능

* 리전(Region)은 클라우드 서비스를 안정적으로 제공하기 위한 복수의 데이터센터로 구성된 지리적 영역

- 데이터센터 내부 온도는 21∼27도를 유지할 수 있는 장소가 적합한데 마이크로소프트는 2018년부터 스코틀랜드 인근 해저에 데이터센터 구축, 북해 바닷물이 서버 열을 냉각하는데 도움

※ 메타도 2016년 바람이 많이 부는 아일랜드 지역에 데이터센터 건립



ㅇ (구글) 서버 전체가 마비되는 극단적인 상황을 가정한 훈련도 반복하고 테러위험 차단을 위한 데이터센터 위치도 비공개

- 구글은 서버 전체가 마비되는 극단적인 상황을 가정한 훈련을 연 2회 이상 진행하며 재해복구 계획을 테스트

※ 마이크로소프트는 연 1회 훈련

- 훈련은 의도적으로 클라우드 서비스를 마비시키거나 특정 시점에 경고 없이 인프라를 마비시켜 약점을 노출시켜 더 나은 복구 시스템을 구축하는 것

- 보안 측면에서도 사용자 개인정보와 데이터를 처리하는 데이터센서는 특급 보안 시설로 분류되는데 외부인 출입이 제한되고 정확한 위치도 대외적으로 비공개

- 이는 테러 위험을 차단하기 위해서이며 설계 단계에서는 지반이 단단한지 등을 점검하고 화재 방지 자재를 사용





1-3.PNG

리포트 평점  
해당 콘텐츠에 대한 회원님의 소중한 평가를 부탁드립니다.
0.0 (0개의 평가)
평가하기
등록된 댓글이 없습니다.