|
|
|
|
|
|
|
|
기술의 발전과 지속적인 투자에도 불구하고, 데이터 관리는 여전히 비용 상승, 시간 낭비 등 풀지 못한 많은 과제를 안고 있다. 정부 규제와 비즈니스 필요조건, 조직 내부 감사 등의 증가로 위험부담은 커지고, 전통적인 데이터 관리 방식은 더 이상 효력을 발휘하지 못하고 있다.
본 청사진에서 여러분은 다단계 스토리지 시스템과 결합된 스냅샷, 복제, 아카이빙 기술이 어떻게 데이터 관리를 진화시키는지 확인할 수 있을 것이다. 이것은 backup-to-disk 전략을 넘어서 RPO/RTO(Recovery Point Objective/Recovery Time Objective)의 서비스 수준을 높이는 것이고 이는 곧 데이터 사용 능력을 말하는 것이다. 이것은 데이터 보호에 복구 관리 기능을 추가했을 때 가능한 것들을 대략적으로 보여준다.
복구 관리의 출현
복구 관리는 지난 1년 만에 독특한 데이터 관리 유형으로 등장하였다. 복구 관리는 기존의 데이터 보호 방식과 비교했을 때 RPO(Recovery Point Objective)와 RTO(Recovery Time Objective) 서비스 수준을 크게 향상시킨다. 이것은 스냅샷과 연속-캡처 복제 기술을 이용해 제작 데이터의 온라인 복제품을 생성, 관리함으로써 가능한 것이다.
이런 데이터는 온라인에 존재할 뿐 아니라 복구 프로세스를 거치지 않고 바로 이용이 가능하기 때문에, RTO 시간은 사실상 ‘즉시’라고 볼 수 있다. 연속-캡처는 대부분의 장애에서 연속적인 RPO를 제공한다. 스냅샷을 통해 바이러스 공격과 기타 데이터 손상 이벤트로부터 데이터를 보호할 수 있으며, 사용 중인 스냅샷의 유형에 따라 RPO 레벨을 1시간 간격이나 그 보다 더 우수한 간격으로 제공할 수 있다.
복구 관리의 장점은 분명하다. 사실 스냅샷과 복제 기술은 신기술이 아니다. 복구 관리를 사용 가능하게 만들어 일정 단계까지 끌어올린 것은, 스토리지-임베디드 스냅샷과 복제 기술의 이용이 널리 확산된 때문이다. 이 기술들은 한 때 고가의 최상위 스토리 장치들에서만 가능했던 기술들이다. 하지만, 이제 제조사들은 이 기능들이 탑재된 미드 레벨 스토리지 시스템들을 제공함으로써 이를 널리 확산시키고 있다. CommVault는 이 임베디드 기술들을 통합하고 자동화된 정책관리를 제공함으로써, 이를 보다 간편하고 단순하게 만들고 있다.
RPO/RTO 서비스 레벨을 크게 향상시키는 것 외에도 데이터 복제를 사용하여 백업 사본을 만들 수도 있다. 이는 제작 데이터에 직접 작업을 하지 않고-이것은 애플리케이션 처리를 늦추거나 방해함-보조 데이터 사본에서 데이터 백업을 취할 수 있다는 것을 뜻한다. 복구 관리 때문에 모든 데이터를 ‘backup window’에 맞춘다는 개념은 갑자기 쓸모가 없는 개념으로 전락해버린 것이다.
RPO와 RTO에 관한 세부 내용
RPO(Recovery Point Objective)에 대해 간단히 정의하면, 기업이 감수할 수 있는 최대 데이터 손실량을 말한다. 이해를 돕기 위해, 기존 데이터 보호에서 어떤 일들이 일어나고 있는지 살펴보기로 하자. 백업은 잘해야 하루 한 번, 그것도 밤에 수행되는 것이 보통이다. 장애가 그 다음날 발생하면, 백업이 작성된 시기와 장애가 일어난 시기 중간에 기록된 데이터는 복구가 불가능하다. 장애가 하루 마감에 즈음하여 발생한다면, 하루 동안의 신규 데이터를 모두 잃어버릴 수 있다. 이런 경우의 RPO는 24시간 분량의 데이터이다.
따라서 RPO를 개선하기 위해서는 데이터를 더 세밀하게 보호해야 한다. 많은 이들이 가장 먼저 생각하는 것이 백업 횟수를 증가시키는 것인데 이는 매우 비현실적이다. 그 이유는 1) 애플리케이션 성능에 영향을 주어 하루 중 최대 사용 시간대에 원활한 성능을 구현하지 못할 수 있다. 2) 데이터 백업 프로세스가 너무 오래 걸린다. RPO를 개선하려면 새로운 방식이 필요하다. 이 새로운 방식을 바로 복구 관리가 제시하고 있다. 연속-캡처와 스냅샷 기술은 둘 다 RPO를 크게 개선시킬 수 있다.
RTO(Recovery Time Objective)를 간단히 정의하면, 기업이 감내할 수 있는 데이터 복구 소요 시간을 말한다. 기존 데이터 보호에서는, 데이터 백업 사본을 바로 사용하지 못하고 먼저 복구가 진행되어야만 한다. 객체-레벨 복구 기능은, 데이터 파일이나 이메일 같은 개별 데이터 객체들은 물론 파일과 우편함의 조합에서도 이것을 보다 효율적으로 할 수 있다. 그러나 전체 데이터베이스와 대용량 데이터를 복구하는 일에는 시간이 걸릴 수밖에 없다. 일반적인 규모의 시스템의 경우 이러한 프로세스는 수 일이 걸릴 수도 있다.
이에 대한 해답은, 미러-이미지 스냅샷이나 연속-캡처 복제, 혹은 그 둘 모두를 이용해 제작 데이터의 온라인 복제본을 만드는 것이다. 복제본이 온라인상에 존재한다면 즉각적인 사용이 가능하다. 데이터에 대한 고속 접근이 가능하여 전체 데이터베이스와 기타 대용량 데이터 세트에 대한 RTO를 5분 이하로 할 수 있다.
스냅샷을 이용한 복구
알아두어야 할 스냅샷 기능에는 copy-on-write(COW) 기술과 미러 스냅샷 기술 두 가지가 있다.
COW는 미러보다 효율적이다. 데이터 사본을 만들지 않고 데이터에 대한 포인터 세트를 만들기 때문이다. 포인트 세트는 가상의 즉각 프로세스로 시스템 오버헤드가 없다. 그래서 시스템 성능 저하 없이 복수의 데이터 point-in-time 스냅샷 사본을 아주 짧은 간격으로 만들 수 있다. 새로운 데이터 조각이 보호 대상 데이터로 한 바이트 이상 기록되면, 그 때 COW 기술은 원본 데이터의 사본을 만들어 이를 보존한다. COW 기능은 데이터 변경이 있을 때 전체 데이터 사본이 아닌 그 변경 내용만 사본으로 만들기 때문에 디스크에서도 효율적이다. 아마도 그 중의 80% 가량은 불필요할 것이다.
그러나 COW 스냅샷에서 복구를 하는 것은 미러 이미지보다 오랜 시간이 소요된다. 복구시 포인터들과 변경된 데이터 바이트들을 읽어 들이는 방식으로 원본 데이터 세트를 다시 만들어야 하기 때문이다. 미러 이미지 스냅샷은 전체 데이터 사본을 다시 생성한다. 이 프로세스는 COW 스냅샷보다는 시간이 오래 걸리지만, 기존 백업을 실행하는 것보다는 훨씬 빠르다. 데이터의 미러-이미지가 온라인상에 있어 바로 사용이 가능하기 때문에 복구 시간이 크게 줄어든다.
연속-캡처 복제를 이용한 복구
연속-캡처 복제 기술은 ROP를 개선하는데 좋은 옵션으로, 꾸준히 ROP를 개선한다. 데이터 변동 사항이 디스크의 제작 데이터에 기록되면, 연속-캡처 기술이 I/O 스트림을 복사하여 두 번째 시스템과 연결된 네트워크 상에 이를 복제한다. 이곳에서 그 I/O 스트림은 두 번째 데이터 사본에 대해 재생된다. 복제 기술은 동기식이 될 수도, 비동기식이 될 수도 있으며 제작 데이터의 사본을 계속 이용 가능하게 보관할 수 있다. 미러-이미지 스냅샷에서 제작 데이터의 사본이 온라인상에 있기 때문에 장애가 발생하면 즉시 이용 가능하며 복구 시간이 크게 줄어들게 된다.
그러나 복제 기술에는 취약성이 있다는 것을 반드시 알고 있어야 한다. 복제 설계상, 제작 데이터의 변동 사항은 두 번째 데이터 사본으로 전송되도록 되어 있다. 여기에는 바이러스 공격이나 기타 이벤트로 인한 데이터 손상도 포함되어 있다. 이 때문에 온라인 데이터 복제품의 스냅샷을 복제와 결합시켜 두 번째 데이터 사본이 바이러스 공격이 있기 전 지점에서 복구되도록 하는 것이 좋다. 이것은 연속-캡처 복제가 모든 종류의 장애 이벤트에서 연속 RPO를 달성하지 못할 수 있다는 뜻이다.
CDP에 대한 계몽
연속 데이터 보호(Continuous Data Protection, CDP)는 연속 RPO 보호를 제공한다는 개념이다. CDP라 불리는 대부분의 내용은 연속-캡처 복제와 스냅샷 보호를 결합하여 데이터 손상을 제외한 모든 이벤트에 연속 RPO를 달성함으로써, 모든 장애 이벤트에 사실상 동시적으로 RTO를 달성한다. 데이터상의 RPO는 가장 최근의 스냅샷이다. 이것은 장애 이벤트가 발생한 시간 범위 내에서 자주 만들어진다.
복제를 스냅샷 기능과 결합시킨 이런 종류의 CDP 솔루션을 대부분 near CDP라고 부르며, 일부는 kind-of CDP라고 부르기도 한다. 대부분의 경우 이 기술들은 접근성이 아주 뛰어나고 실용적이며, 이점의 대부분을 누릴 수 있다.
True CDP 방식은 많은 문제들을 해결함으로써 데이터 손상 이벤트까지 연속 RPO를 제공하고 있다. 그러나 이 방식은 대중화되어 있지도 않고, 많은 하드웨어 공급이 필요할 뿐 아니라 희귀하기도 하다. 이 기술들은 입증된 기술도 아니며 복제와 스냅샷 기능만큼 관리가 쉬운 것도 아니다.
대부분 시스템 및 데이터에서 near CDP는 관리 용이성과 RPO 및 RTO 서비스 레벨 대비 비용의 균형을 맞추어주는 옵션이다.
Singular Information Management의 실제 활용:
복구, 보호, 아카이빙 기능의 결합
본 청사진에서 설명하는 기능들 각자를 개별 벤더들이 제공하는 개별 컴포넌트로서 평가하고, 선택하여 구입할 수 있다. 이것은 기존 데이터 백업 배치를 교체할 수 없을 때 이를 강화하는 유용한 방식이 될 수도 있다. 사실, 같은 벤더가 제공하는 제품을 선택하게 되는 대부분의 경우, 별도 소프트웨어 회사들에 의해 만들어져 제품이 통합되지 않고, 서로 다른 GUI와 인덱스를 사용하며, 소프트웨어 포트폴리오의 간격을 줄이기 위해 취득했다는 명목으로 단일 벤더에게서만 공급을 받는 경우가 가장 많다.
CommVault는 공통의 데이터 관리 서비스로부터 구축된 Simpana suite로 더 우수한 방식을 제공하고 있다. CommVault는 복구, 보호, 아카이빙 관리를 위해 스토리지 단계를 넘나드는 데이터 이동을 목적으로 하나의 GUI와, 하나의 인덱스, 하나의 정책을 제공하고 있다.
본 장에서는 통합 방식이 있을 때와 없을 때의 데이터 관리를 비교, 분석해보기로 한다.
통합 하지 않았을 때의 데이터 관리
만약에 Exchange 데이터 세트와 Oracle 데이터 세트가 있고, 데이터 손상 시 둘 다 한 시간 내에 고속 복구를 해야 하며, 7년의 보존기간 동안 꾸준한 보호가 이루어져야 한다고 가정해보자.
Point-product 방식을 사용하려면, 다음의 소프트웨어 컴포넌트들이 모두 필요하다:
--SAN이나 네트워크-첨부 스토리지에 임베디드 된 스냅샷 기능
--스냅샷을 관리하기 위한 스크립트
– 또는 단일 디스크 브랜드에서만 작동하는 스냅샷 관리 소프트웨어
--백업 소프트웨어
--라이브러리 공유 소프트웨어, 대규모 배치용
--테이프 도약 소프트웨어
이 소프트웨어 컴포넌트들은 독립적으로 작동하는 것이 보통이다. 따라서 별도의 GUI, 교육, 유지관리가 필요하다. 또한 이 소프트웨어는 서로 함께 작동하지 못하는 것이 일반적이다. 예를 들어, 백업 소프트웨어는 스냅샷 관리 소프트웨어에서 지원될 수 없다. 즉, 백업 사본은 스냅샷 사본이 아닌 제작 데이터 사본에서 만들어져야 할 것이며, 백업 과정에서 이 데이터의 사용을 중단하고 시작했던 곳으로 다시 되돌아가야 할 것이다. 하지만, 이 경우에 데이터가 너무 많아 백업 윈도우 안에 잘 맞지 않을 것이다.
스냅샷에서 백업을 취할 수 있다 하더라도, 통합되지 않았기 때문에 쉽게 자동화될 수 없다. 스냅샷을 언제 백업에 사용할 수 있는지 어떻게 알 수 있을까? 스냅샷이 일관성이 없을 때 백업을 어떻게 작성할 수 있을까? 스냅샷 보호를 중단하지 않고 백업으로부터 제작 데이터 사본을 어떻게 다시 복구할 수 있을까? active-migration을 추가하면 더 큰 관리 문제가 생긴다. 따라서 이는 함께 사용하도록 설계되지 않는 한, 문제 해결은커녕 더 많은 문제를 양산할 수 있다. 이런 현실 때문에 필요성의 증가에도 불구하고 기본 이상의 구축이 불가능한 것이다.
Singular Information Management
이와 비교해 통합된 단일 방식은 뛰어난 효율성과 성능을 보여준다. 스냅샷은 백업에 통합되어 있고 데이터가 항상 규칙적이다. 백업과 스냅샷의 작성이 하나의 정책으로 달성될 수 있다. 제작 데이터를 한 번만 손보기 때문에-스냅샷의 경우- 효율성도 매우 뛰어나다. 복구 역시 효율적이다. CommVault의 Proxy host 기능이 백업이 마치 제작 데이터에서 만들어진 것처럼 복구 프로세스를 만들기 때문이다. 클라이언트와 복구할 데이터를 선택하고, 복구 프로세스를 집행하는데 아무런 차이점이 없다.
데이터의 active-migration을 추가할 때, CommVault는 또 다른 통합 기능으로서 이것을 추가하고 있다.
Exchange와 Oracle의 예를 보자:
--CommVault Quick Recovery는 스토리지-임베디드 스냅샷이 Exchange와 Oracle 데이터베이스의 스냅샷을 찍도록 할 수 있다.
-이것은 EMC Clariion, Symetrix, Dell 중단 범위 스토리지 시스템, 델 등의 다양한 스토리지 옵션에서 작동한다.
-CommVault는 스냅된 데이터에서 Recovery Volumes을 구축하며, 이것은 복수의 points-in-time에서 보호를 제공한다. 예: 한 시간에 한 번씩 고속 복구용으로 보존된 가장 최근의 6개를 보호
--CommVault Recovery Director는 스냅샷을 백업용으로 용이하게 사용할 수 있다– CommVault Galaxy를 사용.
---각각의 데이터 세트마다 단일 정책을 사용
--스냅샷이 만들어질 때 제작 데이터에 한 번만 접촉
--CommVault Galaxy는 확장형 Media Agent 아키텍처를 통해 간편하게 장치를 공유함으로써 델의 모든 테이프 라이브러리에 접속하고 관리할 수 있다-추가 소프트웨어 필요 없음
--CommVault VaultTracker는 예정화되고 자동화된 테이프 회전이 가능하고 오프사이트 장소로의 추적이 가능하다.
CommVault는 이 모두를 단 하나의 GUI, 단 하나의 인덱스, 단 하나의 정책관리 엔진, 토탈 장치 공유 등을 통해 제공하고 있다. CommVault Data Archiver를 이용해 active-migration이 추가되면, 백업에 사용되는 디스크와 테이프 스토리지를 같은 Media Agents를 이용해 공유, 관리할 수 있어서 비용절감과 효율성이 확대된다.
결론: 복구, 보호, 아카이빙의 통합 관리
위에서 논의했듯이, 현재 환경에서는 이전보다 더욱 광범위해진 다층적 스토리지가 운영되고 있으며, 우리는 중간 계층의 스토리지를 더 많이 채택할 예정이다. 중간 계층 스토리지는 스냅샷과 복제를 위한 우수한 임베디드 기능들을 더 많이 가지고 있다. 과거에는 이 기능들을 대형 스토리지 장치에서만 이용할 수 있었다.
이 스토리지의 대부분은 우리 환경에서 새로이 등장한 단계로서 Recovery Tier라고 한다. 이 계층은 오래 동안 존재해왔던 Protection tier와 비교적 최근에 등장한 Archive tier를 보완하고 강화한다. 이런 각각의 계층들은 데이터 관리에 서로 다른 기능들과 서비스 레벨을 제공함으로써 대용량 데이터의 관리를 가능하게 한다.
주요 Recovery Tier 기술들
-스냅샷
-연속-캡처 복제
-데이터 분류
주요 Protection Tier 기술
-디스크 기반 백업, disk-to-disk, disk-to-disk-to-tape
-데이터 이동성과 인라인, 보조적, 단계적 데이터 사본
-Direct Access Restore (DAR)
-Single Instance Storage (SIS)
-객체-레벨 복구
주요 Archive Tier 기술
-Active-migration
-Active-archive
-아카이빙 이동성과 인라인, 보조적, 단계적 아카이빙 사본
-이동식 매체에 대한 자동화된 보관 추적
이 기능들은 따로 사용할 수도, 조합해 사용할 수도 있다. 스냅샷과 복제 기술을 사용하면 RPO/RTO 서비스 레벨이 크게 개선된다. 중앙 데이터와 원격 복제는 별도의 장소에 미숙한 인력으로 하여금 데이터 보호를 관리하게 해야 할 필요가 없어 비용절감의 이점이 있다. 온라인 데이터 이미지를 만들어 데이터 백업을 제작 데이터의 보조 사본에서 수행되도록 할 수도 있다. 이렇게 되면 애플리케이션 서비스에 아무 영향도 주지 않고 필요한 백업을 수행할 수 있다. 또한 데이터의 active-migration을 추가해도 관리해야 할 제작 데이터의 양이 크게 줄어들어 시간과 자금이 절약된다.
이 기능들을 공동 관리, 예정, 색인, 복구하는 통합 방식은 가장 비용효율적이면서도 효과적인 방식이다. CommVault 소프트웨어는 이 다층적 스토리지와 데이터 관리를 다루는 Singular Information Management suite를 제공하고 있다. 이것은 하나의 GUI, 하나의 인덱스, 하나의 정책관리 엔진, 하나의 복구 프로세스, 공유 장치 및 인프라를 이용하고 있다. |