データ・サービスをホストするコンピューター・システムには、 数多くの異なる構成要素があり、 各構成要素にはそれに関連した「平均故障間隔」(MTBF) があります。 MTBF は、構成要素が使用可能な状態にある平均時間です。 質の高いハード・ディスクの MTBF は、100 万時間の次数 (約 114 年) です。 これは長期間に思えますが、200 個のディスクのうち 1 つは、 6 か月以内に故障する可能性があります。
データ・サービスの可用性を上げるための方法は多数ありますが、 最も一般的なものは HA クラスターです。 クラスターは、高可用性で使用される場合、 複数のマシン、私設ネットワーク・インターフェースのセット、 1 つまたは複数の公衆ネットワーク・インターフェース、 およびいくつかの共用ディスクから成ります。 この特別な構成により、 データ・サービスを 1 つのマシンから別のマシンに移動させることが可能になります。 データ・サービスをクラスター内の別のマシンに移動することによって、 引き続きそのデータにアクセスすることができます。 データ・サービスを 1 つのマシンから別のマシンに移動することをフェールオーバー といいます。 これは、図 118 で図示されています。
私設ネットワーク・インターフェースは、 クラスター内のマシン間でハートビート・メッセージ および制御メッセージを送信するために使用します。 公衆ネットワーク・インターフェースは、 HA クラスターのクライアントと直接通信するために使用します。 HA クラスター内のディスクはクラスター内の 2 つ以上のマシンと接続されており、 片方のマシンで障害が起きた場合に別のマシンがそのディスクにアクセスできるようになっています。
HA クラスター上で実行されているデータ・サービスには、 1 つ以上の論理公衆ネットワーク・インターフェースと一連のディスクが関連付けられています。 HA データ・サービスのクライアントは、 TCP/IP 経由でデータ・サービスの論理ネットワーク・インターフェースにのみ接続します。 フェールオーバーが起きると、 データ・サービスは、論理ネットワーク・インターフェースおよびディスクのセットとともに、 別のマシンに移動します。
HA クラスターの利点の 1 つは、 サポート・スタッフの援助なしでデータ・サービスを回復できることと、 いつでもそれを行えることです。 もう 1 つの利点は、冗長度です。 マシン自体を含め、クラスター内のすべての部分に冗長度があります。 クラスターは、どんな単一の障害が起きても、存続することができます。
高可用性データ・サービスはそれぞれ性質がかなり異なる場合がありますが、 いくつかの共通要件があります。 高可用性データ・サービスのクライアントは、 データ・サービスがどのマシン上にあっても、 データ・サービスのネットワーク・アドレスおよびホスト名が同じであり、 同じ方法で要求を出すことができると予期します。
高可用性 Web サーバーにアクセスする Web ブラウザーを考慮してみましょう。 要求は URL とともに発行されます。 URL には、ホスト名と、Web サーバー上のファイルへのパスの両方が含まれます。 ブラウザーは、 Web サーバーのフェールオーバー後もホスト名とパスが同じであると予期します。 ブラウザーが Web サーバーからファイルをダウンロードしているときに、 サーバーがフェールオーバーされると、 ブラウザーは要求を再発行する必要があります。
データ・サービスの可用性は、 データ・サービスがユーザーから使用可能である時間の合計により測定されます。 可用性の最も一般的な測定単位は、 「アップ時間」のパーセンテージです。 これはしばしば、複数の「9」によって示されます。
99.99% => サービスは、1 年で (最大) 52.6 分ダウンする。 99.999% => サービスは、1 年で (最大) 5.26 分ダウンする。 99.9999% => サービスは、1 年で (最大) 31.5 秒ダウンする。
HA クラスターを設計し、テストするときは、
データ・サービスの可用性を上げる別の方法は、 フォールト・トレランスです。 フォールト・トレラント・マシンには、 すべての冗長度が組み込まれており、 CPU やメモリーを含む任意の部分で起きる単一の障害に対処することができます。 フォールト・トレラント・マシンは、隙間産業で最も良く使用され、 通常、このマシンを実装するには費用がかかります。 地理的に別の場所にあるマシンを含む HA クラスターには、 これらの場所のサブセットだけに影響を与える災害から、 回復することができるという利点があります。
連続可用性 は、 高可用性の上位ステップです。 これにより、 計画済みおよび非計画のダウン時間からクライアントが保護されます。 連続可用性が構成されていると、 データ・サービスをホストするマシンの 1 つで障害が起きたり、 または保守のためにダウンしたりした場合に、 クライアントはまったく影響を受けません。 連続可用性の構成は複雑で、 実装にさらに費用がかかります。
HA クラスターは可用性を上げる最も一般的な方法です。 なぜなら、拡張が容易で、使いやすく、そして比較的実装に費用がかからないからです。