データセンター内のネットワークを二重化するサービスです。WEBサービス事業や、ホスティング事業を営むお客様にとって、ネットワークの停止は、信用の失墜や重大なビジネスチャンス損失に直結します。なぜなら、単一のWEBサーバ、アプリケーションサーバが故障した場合には、特定のサービスのみが停止するという被害で済みますが、ネットワークが停止した場合には、そのお客様が、提供する全てのサービスが全滅してしまうからです。実際にこの様な事故が発生したために、お詫びの行脚に出向く「謝り侍役」の憂き目に遭った方も数多くいらっしゃると思います。また、昨今ではネットワーク冗長化されていることが必須要件となっている案件が、多くなっているのではないでしょうか。

弊社では、比較的ローコストでありながら、ネットワーク全停止のような大事故のリスクを、最小限に抑えるためのインフラ構築をご提案いたします。

 

ネットワーク停止の原因

 LANケーブルの切断、L2スイッチの故障、NICの故障などの小さな障害がネットワーク全停止に繋がる場合があります。主要なネットワーク機器のファームウェアアップデート、設定変更のためのリブート、ハードウェア交換などのメンテナンス作業においても、ネットワーク を停止しなければなりません。

冗長化されていないネットワークの場合

 次の図の例では、ロードバランサ(LVS)でサーバ の負荷分散を行っていますので、サーバが一台故障したとしても、サービスを継続できます。しかし、ルータ、スイッチ、ロードバランサなどのネットワーク機器については冗長化されていないため、これらのどれ一つ壊れたとしても、サービスを継続することができなくなります。

 

正常稼働時
正常稼働時
障害発生時
障害発生時
 
 

ネットワークの冗長化

ネットワークの冗長化には、以下のようなテクノロジーを利用します。

◇NICの冗長化(Linux Bonding)

  Bondingにはいくつかの動作モードがありますが、次のactive-backupモードを利用します。

  • 通常は1つのNICのみ有効とし、通信不可となった場合にその他のNICがホットスタンバイとして自動的に切り替わりフォールト・トレランス機能を提供します。


◇ラピッドスパニングツリープロトコル(RSTP)

  • スイッチの冗長化のために、物理的にループ構成が避けられない場合、RSTPにより、特定のポートをブロッキング状態にし、ブロードキャストストームの発生を防ぐことができます。機器故障などにより物理的ループ構成が解消される場合に、今までブロッキング状態だったポートがフォワーディング状態になるため、代替経路が確保できます。

構成例

 次の図はネットワーク冗長化構成の一例です。スイッチを冗長化すると、「ルータ1」-「L2スイッチ1」-「L2スイッチ2」の間にループ構成が発生します。正常稼動時はRSTPの機能により、「ルータ1」-「L2スイッチ2」間のリンクにおいてL2スイッチ2のポートがブロックキング状態になるので、ブロードキャストストームが発生することはありません。LVSの外側のインターフェースに関しては、L2スイッチ1、L2スイッチ2の双方に接続していますが、ボンディング機能によりL2スイッチ1への接続のみが、activeとなっています。

ネットワーク冗長化構成例
ネットワーク冗長化構成例

障害発生時の経路

L2スイッチ1の障害

 L2 スイッチ1に障害が発生すると、RSTPの機能により今までブロッキングだった「L2スイッチ2」のポートがフォワーディングに変わり、ルータ1-L2スイッチ2間の経路が確保されます。また、Bondingのactive-backupモードの機能により、L2スイッチ1とLVS1間の経路は自動的にL2スイッチ2と LVS1間の経路に切り替わります。

L2スイッチ1が故障した場合
L2スイッチ1が故障した場合

L2スイッチ3の障害

 L2スイッチ3が故障すると、LVS1とサーバ1のボンディングのアクティブインターフェースが切り替わるため、瞬時にL2スイッチ4を経由した経路に切り替わります。

L2スイッチ3が故障した場合
L2スイッチ3が故障した場合

リンク障害

 LVS1のNICの故障やとL2スイッチ3のポートの接触不良などによりリンク障害が発生した場合、Bondingのactive-backupモードにより、別のNICに自動的に切り替わります。

リンク障害の例
リンク障害の例
 

LVS1の障害

 LVS1に障害が発生すると、LVS2はVRRPによりシェアしているゲートウェイ用のIPアドレスを引き継ぎ、自動的に通信を引き継ぐことが可能です。

LVSのフェイルオーバー
LVSのフェイルオーバー

完全冗長化ソリューションのメリット

以上の様に、ネットワーク機器に障害が発生した場合でも、それぞれの機器がアクティブ側からバックアップ側に自動的に切り替わるため、ネットワークを全停止する危険性を小さくすることができます。同様に、機器の交換やメンテナ ンスもサービスを止めることなく行うことが可能となります。 また、比較的安価なスイッチと、Linuxベースのオープンソースなロードバランサ(LVS)を採用しているため、インフラコストを低く抑えることができます。