Disaster Recovery(ディザスタリカバリ)とは、災害などによるシステムダウンに備えて、復旧の仕組みを構築しておくこと。BCPとの違い、プランや指標などについて解説します。
目次
1.Disaster Recovery(ディザスタリカバリ・DR)とは?
Disaster Recovery(ディザスタリカバリ)とは、災害や事故による被害でシステムが正常に作動できなくなったとき、速やかに復旧させるための仕組みあるいはシステムのこと。たとえば次のような災害が想定されます。
- 地震や台風などの自然災害
- 停電や断線などにともなうインフラの障害
- データやシステムを運用するセンターの障害
- マルウェアやハッキングなどによるサイバー攻撃
しかしどれほど備えても災害を完全に防ぐのは不可能です。そのため災害に見舞われた際に、最小限の被害に食い止めて、速やかに復旧させるための仕組みや手順、設備などが必要とされます。
日本語に訳すとなんと表現する?
日本語では「災害復旧」や「災害復興」などと表現されます。Disaster Recovery(ディザスタリカバリ)におけるそれぞれの単語の意味は次のとおりです。
- Disaster:生命や財産に大きな損失を与えるほどの災害や惨事
- Recovery:回復や復旧、修復
Disaster Recoveryを直訳すると「大きな災害からの復旧」と表せます。
2.Disaster Recoveryの意味と目的
2011年に発生した東日本大震災では、日本中の企業が大きな障害とダメージを被りました。さらに近年、サイバー攻撃やハッキングなどの悪意をもった攻撃も想定しなければなりません。
そのため企業では、このような災害によるシステムダウンへ対策を講じておく必要があるのです。それでは、企業がDRに取り組む意味と目的を解説します。
Disaster Recoveryを実施する意味
Disaster Recovery(DR)を実施する意味は、企業が存続していくための危機管理にほかなりません。
システムへ甚大な被害をおよぼす要因として挙げられるのは、地震や台風などの自然災害、不正アクセスやマルウエアなどによる悪意のある攻撃、さらには企業内でのミスやエラーによる障害など。またこれらはいつ起こるか予想ができません。
そのため起こりえるリスクとその被害を想定し、事前に対策を講じておく必要があるのです。そのためDRは、経営者のみならず全社で取り組むべきリスクマネジメントのひとつに含まれます。
Disaster Recoveryを実施する目的
Disaster Recoveryを実施する目的は、災害や障害、あるいは攻撃によってシステム障害が発生した際、企業の損失を最小限に食い止めたうえで、できる限り早く復旧させること。
このような災害でシステムに障害が発生すると、多くの場合で機能低下や稼働停止などを引き起こします。
業務やサービスの提供が遅滞する恐れもあり、自社の生産性や利益を損ねるだけでなく、顧客からの信頼も失いかねません。また復旧が遅れると、データの消滅や漏えいといった二次被害も呼び込むでしょう。
このような事態を防ぐために、企業はDisaster Recoveryに取り組む必要があるのです。
3.Disaster RecoveryはBCPと何が違うのか?
企業に求められる危機管理方法のひとつに、BCP(事業継続計画)があります。BCPとDRの違いに関して解説します。
BCPとは?
非常事態が発生した際、いち早く復旧して事業運営を存続させるための計画。「Business Continuity Plan」の頭文字をとった略称で、日本語では「事業継続計画」と呼ばれます。BCPでは、想定されるリスクについて次のような内容を定めるのです。
- BCPを発動する基準と体制
- 各リスクにおいて目標とする復旧レベル、および復旧までの時間やリソース
- 障害発生時の代替方法
策定されたBCPは文書化して全員へ共有し、定期的に見直しましょう。また社内外の環境変化に応じて改善していくのも重要です。
BCP(事業継続計画)とは? 意味や作成方法、対策を簡単に
災害時の在宅勤務に使えるツールの選定にお悩みではありませんか?
クラウド型タレントマネジメントシステムなら、いつでもどこでも、過去から現在までの人材情報を閲覧できるので、個々にあわせたコミュニケーショ...
Disaster RecoveryとBCPの違い
Disaster RecoveryとBCPの違いは、「復旧の対象範囲」です。
- BCP:非常事態が発生した際に、「事業」を速やかに継続させるための計画
- DR:非常事態で発生した「システム障害」を速やかに復旧させるための施策
BCPは事業全体の存続を図るための計画、DRはシステム障害に言及するリカバリー策です。企業のリスクマネジメントのひとつがBCP、このBCPで策定する計画のひとつがDRといえます。
そのためBCPの範囲は多岐にわたるのです。たとえば「本社が災害を受けても業務を継続できるよう、普段から本社機能を支社へ分散しておく」といったものもBCPに含まれます。
4.Disaster Recoveryプランとは?
災害によるシステム障害が発生したとき、迅速な復旧を行う計画書のこと。「災害復旧計画」とも呼ばれます。Disaster Recoveryプランで定める項目は、下記のようなものです。
- 想定するシステム障害
- 復旧の担当者と役割
- 復旧における目標
- バックアップしたデータの復元手順
- 応急処置
- 完全復旧までの手順
Disaster Recoveryプランの策定では、システムが遅滞すると事業に大きな被害が生じる業務を優先しましょう。
5.Disaster Recoveryサイトとは?
災害によるシステム障害が発生した際、システム機能の一部、あるいはすべてを代替する施設や設備のこと。サイト(Site)は「場所」を意味する英語です。
DRサイトは、主要拠点とはできるだけ離れており、かつ自然災害が起きにくい場所がよいでしょう。双方の場所が近いと、同時に被災する恐れもあるからです。実際に東日本大震災以降は、多くの企業がDRサイトを構築するようになりました。
6.Disaster Recoveryに欠かせないふたつの指標
DRP(災害復旧計画)の策定において、復旧の指標となるのがRPO(目標復旧時点)とRTO(目標復旧時間)です。
RPO(目標復旧時点:Recovery Point Objective)
システム障害が発生した際、「どの時点までさかのぼって復旧させるか」を表す「目標復旧地点」のこと。
たとえば毎日23時にバックアップ作業を行っているとしましょう。午前10時に障害が発生した場合、最短で可能となるRPOは前日の23時です。
RPOを短く設定するほど最新の状況へ復旧できるでしょう。ただし設備や管理者に負担がかかるため、リスクレベルとコストのバランスを考えなければなりません。
RTO(目標復旧時間:Recovery Time Objective)
システム障害が発生した際、「どの程度の時間で復旧させるか」を表す「目標復旧時間」のこと。
ただし「復旧に要する目安時間」ではなく、「事業継続のために認められる最低限の復旧時間」です。たとえばRTOを24時間に設定した場合「最優先にするのは24時間以内にシステムを復旧させること」を意味します。
RTOは、先ほどのRPOや、目標とする復旧レベルとを考慮して決定するのが一般的です。
7.Disaster Recovery対応のシステムを選ぶポイント
これからシステムを導入するなら、Disaster Recoveryを考慮したうえで選定しましょう。ここでは3つのポイントを説明します。
- レプリケーションの性能
- 理想とするDRサイトの構築の可否
- 適正なコスト
①レプリケーションの性能
レプリケーションとは、主要システムを正確に複製して同レベルで保持すること。システムの複製(レプリカ)を作ることを意味します。
本システムと同等の性能を持つ複製システムをRTPサイトに構築すれば、本拠地のシステムがダウンした場合に即座に切り替えて稼働を継続できます。
ただしレプリケーションはバックアップと違い、本システムのすべてを複製するので注意が必要です。つまり本システムに発生した不具合や操作ミスなども、そのまま複製してしまいます。
データ保護の観点から、レプリケーションだけに頼らずバックアップを併用するほうが安心です。
②理想とするDRサイトの構築の可否
理想とするDRサイトの種類、およびその構築と運用が可能かを検討しましょう。DRサイトは、次の3種類にわかれます。
- ホットサイト(Hot Site):本システムとほぼ同様のシステムを別拠点で稼働させておき、災害時に切り替えて稼働を引き継ぐ
- ウォームサイト(Warm Site):本システムとほぼ同様のシステムを別拠点に構築しておき、災害時に切り替えて稼働を引き継ぐ
- コールドサイト(Cole Site):別拠点にネットワークインフラや最低限の設備のみを用意しておき、災害時に本システムと同様のシステムを構築する
システム障害による被害をもっとも抑えられるのは、ホットサイトでしょう。しかしすべてのシステムをホットサイトにする必要があるかどうかは疑問が残ります。
「被害を最小限にして事業継続するために、どのDRサイトがもっとも適切なのか」を十分に検討する必要があるでしょう。
③適正なコスト
先に挙げたDRサイトを導入する場合、大きなコストがともないます。たとえばつねに複数のシステムを稼働させるホットサイトでは、障害発生時には即時に切り替えできるのがメリットです。
しかしその反面、機器や設備の費用と、日々運用管理を行う人件費がかさみます。つまり平常時においてもシステム運用コストが増加するのです。
多大なコストをかけて障害に強いシステム環境を確保した結果、利益を大きく下げてしまう恐れもあります。導入予算に合ったDRサイトを選ぶのはもちろん、クラウドサービスなども利用してコストを削減するのも検討しましょう。