클라우드 시장, 아마존·MS·구글이 65% 장악
'빅3 집중' 리스크 부각…"사고시 피해도 그만큼 커"
복구도 어려워 경제 손실↑…“다중 클라우드 필수”[이데일리 방성훈 기자] 아마존웹서비스(AWS) 대규모 전산 장애로 전 세계 2500여개 기업 및 정부 기관이 동시에 마비됐다. 단 하나의 시스템 오류가 항공·금융·게임·통신 등 산업 전반에 걸쳐 연쇄 피해를 일으켰다. 미국 3개 클라우드 서비스 기업이 전체 시장 60%를 장악한 가운데, 소수 기업에 집중된 인터넷 인프라의 취약성이 재조명받고 있다.
|
글로벌 디지털 생태계 한순간에 ‘멈춤’…경각심↑
미국 동부시각 기준 20일(현지시간) 오전 12시 11분, AWS의 미국 버지니아주 노스버지니아 데이터센터에서 발생한 서버 장애가 순식간에 전 세계로 확산했다. BBC방송은 이번 사고로 1000개가 넘는 회사와 수백만명의 인터넷 사용자가 피해를 입었다고 보도했다. IT 장애 모니터링 사이트 다운디텍터는 이날 2500곳에 달하는 기업 및 정부 기관 서비스에서 장애가 발생했으며, 대부분이 AWS 통신 장애와 관련이 있었다고 보고했다.
실제 인공지능(AI) 챗봇·게임·소셜미디어(SNS)·동영상 스트리밍(OTT) 등 각종 플랫폼 이용자부터 주식·가상자산 투자자, 금융 서비스·항공·통신 고객 등까지 전 세계 곳곳에서 피해 사례가 보고됐다. 영국에선 국세청 웹사이트가 다운되고, 증권거래소 온라인 데이터 서비스가 중단됐다. 로이드은행·스코틀랜드은행·핼리팩스은행 고객들은 모바일뱅킹 접속이 차단됐다.
가상자산 거래소인 코인베이스와 통신사인 브리티시텔레콤·티모바일 등도 피해를 입었으며, 심지어 아마존 자체 영상 서비스인 링 도어벨과 음성비서 알렉사도 정상적으로 작동하지 않았다.
소셜미디어(SNS)에는 세계 각지에서 불편을 호소·비난하는 불만 게시글이 쏟아졌다. 미국 노트르담대학의 마이크 채플 교수는 “마치 인터넷 대부분이 일시적으로 기억상실에 빠진 것 같았다. 클라우드 서비스 업체가 재채기를 하니까 인터넷이 감기에 걸렸다”고 묘사했다.
원인은 AWS의 ‘DynamoDB’(고성능 데이터베이스 서비스) API 엔드포인트 도메인네임시스템(DNS) 오류로 확인됐다. DNS는 인터넷 ‘전화번호부’ 역할을 하는 시스템으로, 이 기능이 정지하면 애플리케이션 전체가 마비된다.
아마존·MS·구글 ‘빅3’ 65% 장악…리스크 부각
이번 사태는 클라우드 서비스가 소수 업체에 집중된 데 따른 심각성을 일깨워줬다는 평가다. 미 시장조사업체 시너지 리서치 그룹에 따르면, 올해 2분기 기준 AWS, 마이크로소프트(MS) 애저(Azure), 구글 클라우드 등 미국 3개 기업이 전 세계 클라우드 인프라 시장의 약 63~65%를 점유하고 있다. 개별 점유율로는 AWS가 29~32%로 1위, 애저가 22~23%로 2위, 구글 클라우드가 12~13%로 3위를 차지했다.
클라우드 서비스 시장은 연평균 21~23% 성장하고 있으며, AI 발전과 함께 앞으로는 더욱 가속화할 것으로 예측된다. 데이터센터 등에 천문학적 투자금을 쏟아붓고 있는 3사의 지배력은 더욱 강화할 전망이다. 이미 3사의 수주 잔고 총액은 올해 2분기 기준 6690억달러에 달한다.
이는 그만큼 많은 기업들이 3사에 의존하고 있다는 의미다. 즉 3사에 문제가 발생하면 이번 사태와 같은 일이 반복될 수 있고, 경제적 피해도 그만큼 커질 것이란 얘기다. 지난해에도 보안 소프트웨어 기업 크라우드스트라이크의 업데이트 오류로 전 세계 850만대 단말기가 영향을 받았다.
|
“소수 의존해 사고시 피해도 커…다중 클라우드 필수”
이번 사고는 복구가 이뤄지긴 했지만, 그 경제적 파장은 막대했다. CNN은 피해액이 수천억달러에 달할 것으로 추산했다. 다만 AWS 측 보상은 대부분 서비스 크레딧 형태로 제공될 전망이다.
시장조사업체 퓨처리움은 “마이크로서비스 기반 최신 클라우드 아키텍처는 한 서비스 장애가 도미노처럼 다른 서비스로 확산되는 구조적 취약점을 안고 있다”며 일반적으로는 복구도 상당한 시간과 비용이 소요된다고 지적했다.
문제는 유사한 사고가 자주 발생할수록 기업들의 리스크 대비 비용 부담도 커질 수 있다는 점이다. 영국 무역신용보험사 아트라디우스는 급작스러운 온라인 서비스 중단은 기업 생존을 위협할 수도 있다고 경고했다.
정부와 기업들은 이번 사태를 계기로 클라우드 서비스의 탈집중화, 비상 대응 계획 수립, 계약 조건 재검토 등 실질적 대응책 마련에 나서야 한다고 전문가들은 한목소리로 강조했다. 통신 분석기업 우클라의 루크 키호 애널리스트는 “향후 이러한 파괴적 장애를 완화하려면 여러 지역에서 여러 클라우드를 사용하는 다중 전략이 필수적”이라고 조언했다.
일부 기업은 다중 클라우드 전략에서 벗어나 온프레미스(자체 인프라) 하이브리드 클라우드 아키텍처로 회귀하고 있지만, 거의 모든 기업이 클라우드 서비스를 이용하는 만큼 현실적 제약도 크다는 진단이다.
통신 솔루션 기업 엘리먼트의 아만딘 르 파페 최고운영책임자(COO)는 “중앙집중식 시스템은 편의성과 규모를 제공하지만 디지털 단일 장애점(Single Point of Failure)도 만든다”며 “진정한 회복력은 분산화와 자체 호스팅에서 나온다”고 말했다.