안녕하세요
알리바바 클라우드 국내 유일 공식 총판 메가존소프트입니다 .
저희 메가존소프트와 알리바바클라우드가 진행한 웨비나가 성공적으로 마무리 되었습니다.
그래서 오늘은 중요했던 내용을 여러분과 함께 리뷰해보는 시간을 가져보도록 하겠습니다.
DR 시스템이란 ?
우선 이번 웨비나의 주제이자 핵심 키워드 DR 시스템이 무엇인지 부터 정리해보겠습니다.
근래에 데이터 센터 화재 발생으로 여러 어플리케이션의 사용이 불가능해지면서 많은 분들이 어려움을 겪기도 했습니다.
이런 상황에 대비하기 위해서 구축하는 것이 바로 DR 시스템입니다.
이는 Disaster Recovery System 의 약자로, 예상치 못한 상황에 대비하여 데이터 센터를 보호하는 복구 시스템을 의미합니다.
Disaster 라고 하면 보통 지진, 화재와 같은 자연 재해만 생각하시는 분들이 계실것 같은데요,
위와 같이, 시스템 오류, 랜섬웨어, 유지보수 사고 등 짧은 시간안에 시스템을 복구하기 어려운 여러 상황들을 모두 포함합니다.
또한, 이러한 다양한 리스크에 대응하는 ‘비즈니스 연속성’이라는 개념으로도 이해할 수 있는데요,
*비즈니스 연속성 이란 무엇일까요?
합리적인 RTO 및 RPO(아래 설명 참고) 를 통해 구축하는 주요 비즈니스의 지속적인 운영을 의미합니다.
‘업무 연속성이’라고 불리기도 하는 이 개념은 긴급 상황으로 중단이 발생하였을때 얼마나 빠르게 조직의 시설이 정상적으로 운영 될 수 있는지를
나타내는 대비 수준입니다.
Types of Backup Sites
Mirror site, Hot & Warm & Cold Site
DR 시스템을 구분 하는 기준은 조금씩 차이가 있을 수 있습니다.
이번 웨비나에서는 알리바바 클라우드의 기준으로 정리해 보았는데요 !
위 도표를 참고하여 쉽게 이해하실 수 있고,
더 간단히 정리해 보자면, 아래와 같이 4가지 유형으로 정의할 수 있습니다.
-
Mirror : 무중단 실시간 동기화로 Active- Active 시스템, 동일한 수준의 원격시스템 구축
-
Hot : 10분 내외로 동기화 하여 장애가 났을 경우 사용할 수 있는 Standby 시스템
-
Warm : 시간 단위의 DR 리소스 마련
-
Cold : 일 단위의 DR 리소스 마련
얼마나 안정적으로 비즈니스 연속성을 유지할 수 있는지가 리소스 마련 주기에 따라 차등 구분되는 것을 알 수 있습니다 !
그럼, 앞에서 Mirror와 Hot은 백업 주기가 초 혹은 분으로 시간 차이만 있고 비슷한 유형인가 생각하셨을 수도 있는데요.
위의 그림을 통해 두 Site의 차이를 알아보겠습니다.
두 유형이 비슷하긴 하지만, Mirror Site의 경우 일부 트래픽은 다른 *AZ 으로 가도록 하여 Active-Active 방식이고
Hot Site 의 경우는 Active-Standby 방식으로 하나의 AZ은 장애가 났을 경우에만 사용되는 시스템인거죠.
* AZ: Availability Zone, 가용 영역
리전이 말그대로 물리적 위치라면, AZ는 그 안에서 분리되어 있는 개별적 위치라고 볼 수 있다. 즉, 한 리전내에 여러개의 가용 영역이 존재한다.
예를 들어, 알리바바 클라우드는 전 세계 28개의 리전에서 85개의 가용 영역을 운영합니다.
알리바바 클라우드에서는 두 AZ를 Active-Active 혹은 Active-Standby로 사용할 수 있도록 ‘GTM 서비스‘를 제공하고 있습니다.
간단히 설명하면, 알리바바 클라우드의 GTM을 이용해, 다양한 지역의 user가 가장 가까운 엑세스 포인트에서 서비스를 사용하게 하거나
대기 시간이 가장 짧은 서버로 사용자의 요청을 라우팅시킬 수도 있고, Active 환경에 장애가 발생하면 Standby 환경으로 서비스를 전환할 수 있는 것이죠.
이렇게 조건에 따라서 유형을 선택하는데 필요한 용어 두가지가 있는데요 !
-
RPO(Recovery Point Objective) : 재해 시점으로부터 데이터 백업을 해야 하는 시점까지의 시간
-
RTO (Recovery Time Objective) : 서비스가 중단 되었을때 서비스를 목구하는데 까지 걸리는 최대 허용시간
위의 그래프를 본다면 ROP와 RTO에 따라서 필요한 예산의 차이가 있는 것이 보입니다.
그럼 중요도가 그렇게 높지 않은 프로그램 같은 경우에는, 구축 비용을 줄이고 데이터 복구가 되는데 걸리는 시간을 감내하는 선택도 가능하겠죠 !
이처럼 어느 정형화된 유형이 존재하기 보다는 각 상황에서 비용과 조건을 고려하여 DR 시스템 구축 유형을 결정할 수 있습니다.
이제 그럼 필요 조건에 따라 선택해 볼까요?
위 두 그래프를 예시로 DR 알맞는 시스템을 선택해보겠습니다.
우선 오른쪽 그래프를 보면, 고객의 예산 범위 안에 들어오면서, Customer RTO를 넘지 않는 시스템은 Warm Site가 되겠네요!
왼쪽 그래프에서도 마찬가지로 ,고객 예산 범위 안에서, Customer RPO를 넘지 않는 시스템도 역시 Warm Site가 적절하겠습니다.
위 두 그래프의 예시처럼 고객의 예산과 요구조건에 따라서 알맞은 DR 시스템 유형을 선택할 수 있습니다.
Hybrid DR System
DR 시스템 구축의 종류에 대해서 알아보았는데요.
자 여기서 한가지 더,
Hybrid Cloud DR 시스템 은 무엇일까요 ?
하이브리드 클라우드란 온프라미스 환경과 클라우드 서비스를 혼용하여 DR을 구축하는 방법입니다.
이렇게 재해 복구 시스템을 구축하게 되면 물리적 시스템 환경과 클라우드 환경을 결합한 DR 시스템을 동시에 구축할 수 있기 때문에 비용 및 보안 측면에서 효과적인 해답이 될 수 있습니다. 위의 그림을 보면 양측으로 중복되어 구성되는 시스템을 이해할 수 있습니다.
성공 사례
DR 시스템에 대한 이해가 어느정도 되었으니, 시스템이 잘 적용된 성공 사례는 어떤 것들이 있는지도 살펴봐야겠죠?
위에 나온 두 실제 사례를 소개하고 오늘 리뷰를 마무리 하도록 하겠습니다.
1. Data Backup and DR for Games Event
이 사례는 정부에서 게이밍 이벤트를 개최하여 단 1초도 서비스 Down time을 가져가서는 안되는 경우였습니다.
그래서 하나의 리전에 두개의 AZ를 그대로 사용하는 DR도 구성하고 (=Mirror Site)
또 다른 리전에 이 전체 서비스에 대한 DR Site을 구성하는 적극적, 소극적 방법을 둘다 실현했던 케이스입니다.
그런데 실제로 여기서 돌발 상황이 발생했었다고 합니다!
갑자기 서비스가 중단이 되었었는데요. AZ1에 있는 ECS 인스턴스가 멈추게 되었지만
Mirror Site로 구성되어있던 AZ2에 전체 트래픽이 바로 실행되어
고객들은 1초도 자각하지 못하는 서비스 Down time을 이뤄낼 수 있었다고 합니다.
확실하고 단단한 DR 시스템 구축의 중요성을 깨닳게 해주는 사례였네요 !
2. Data Backup and DR from Gov Cloud to IDC
두번째 사례도 특이한 케이스입니다!
아까 설명드렸던 하이브리드 시스템 기억하시나요?
이번 사례도 정부 클라우드의 예시로, 온프라미스 사이트에 대한 백업을 클라우드에 적용켰던 유형입니다.
알리바바 클라우드가 가진 기술을 사용하여 (HBR 백업 솔루션)
로컬 IDC를 클라우드 전용선에 연결하여 구축하는 방법을 통해 기존의 하드웨어를 사용하여 DR시스템을 구축 할 수 있었다고 합니다.
여기까지 각 사례를 통해서 필요한 요구사항이 무엇이었는지, 그에 따라 어떤 적절한 솔루션이 제안 되었는지.
결과적으로 어떤 베네핏이 발생되었는지까지 살펴보실 수 있었습니다.
이번 웨비나를 통해 저도 DR의 중요성을 더 느끼게 되었는데요!
여러분도 DR 시스템에 대해 이해하는데 도움이 되셨나요?
오늘은 이렇게 알리바바 클라우드의 시니어 솔루션 아키텍트와 메가존의 컨설턴트가 진행했던 DR 시스템 구축 웨비나에 대해 리뷰해 보았습니다.
웨비나 FULL 영상 링크를 남겨드리니, 더 자세한 설명이 듣고 싶으시다면
아래 유튜브로 이동하여 더 알아보실 수 있습니다 : )
알리바바 클라우드 국내 유일 공식 총판 메가존소프트 마케팅 팀 이었습니다 !