MEGA-NETホスティングサービス
1月9日 障害についての報告書
|
■サービス障害の発生原因及び経緯
2008年1月9日に発生いたしました「MEGA-NETホスティングサービス」の障害につきまして、下記のとおりご報告申し上げます。
● 障害対象サービス
メガ共用サーバー「MEGA-NETホスティングサービス」(MEGAプラン)
● 障害発生期間
2008年 1月9日(水) 6:30 〜 2008年 1月9日(水) 12:30
プログラムが正常に稼動しない状況が発生しました。
● 障害内容
今回の障害内容につきまして、「システム面」「サービス面」の両面からご報告いたします。なお、「システム面」につきましては、「MEGA-NETホスティングサービス」のネットワーク構成図を用いてご報告いたします。
■
障害内容について
1) 「システム」面からのご報告
※上記構成図は説明を分かりやすくするため一部簡略化されています。
図A:「MEGA-NETホスティングサービス」のネットワーク構成 [拡大図]
「MEGA-NETホスティングサービス」は、図Aのとおり、ネットワーク回線、サーバー機器など、サーバー障害の要因となる可能性を持つコンポーネントを冗長化/二重化し、耐障害性の向上を目的に開発された共用サーバーです。
今回の障害は、ウェブサーバーやメールサーバーなどの“各種サーバー類”と“データー格納機器” とを接続するための、『スイッチ(略称:L2SW)』という機器で障害が発生いたしました。
平常時は、図Bのように各系統ごとにデーターの通信が行われます。ハードウェア(ウェブサーバーやメールサーバーなどや、データー格納機器、サーバー接続機器など)もしくはハードウェア同士を接続するケーブル類で障害が発生した場合、図Cのように、その前後の段階で、障害発生ポイントを迂回するための切り替えが自動的に行われます。
● 今回の障害発生時の場合
 |
今回の障害では、下記のような状況に陥りました。
1. サーバー接続機器で障害が発生したことを検出できなかった
2. そのため、通信経路の切り替えが自動で行われなかった
3. 障害発生機器の下流の機器類との通信が途絶えた
障害ポイント配下のデーター格納機器(NAS)には、サーバー管理・運用のための、下記の情報が保管されています。
・各サーバーの設定ファイル
・ドメインごとのオプション利用有無
|
今回の障害で、上記の設定ファイルが読み込めなくなり、全てのサーバーが利用できなくなりました。この結果、どの経路を経由しても、どのNASにウェブコンテンツやメールデータが格納されていても、アクセスしたり読み出したりすることができなくなりました。
このたびの障害内容である「通信経路が自動的に切り替わらなかった」原因につきましては、現在ベンダーも含め、調査を継続中でございます。詳細がわかり次第、当社ウェブサイト(http://www.mega.ad.jp/)にてお客さまにご報告申し上げます。
2) 「サービス」面からのご報告
○サーバー監視体制について
メガでは、24時間365日、有人体制でサーバー監視を行なっております。しかし、今回、初期挙動を検知したのち、問題の切り分け、共有、対応、復旧までに数時間もの時間を要する結果となりました。
メガでは、このたびの障害にとどまらず、お客さまの信頼回復と障害の再発を防止すべく、「障害対策プロジェクト」を定時運営し、システム、サービスの両面から強化対策を実施してまいります。
■
「システム面」「サービス面」の両面からの強化対策項目
<システム面>
○サーバー設備の見直しおよび増強
○サーバー監視体制の強化
→内部監査体制の強化。障害検知および対応スピードのUPを実現
○迷惑メール(スパム)フィルターのご提供
→MEGA-NETホスティングサービスの手前で迷惑メール(スパム)を排除するような製品の検討
これにより、MEGA-NETホスティングサービスへのサーバー負荷を軽減し、メールレスポンスを向上
<サービス面>
○障害の有無に関係なく、ウィルス情報などお客さまに役立つ情報の提供
これにより、万が一障害が発生した場合も、情報公開のリアルタイム性、問題や原因の発見や切り分けの迅速化などを可能にし、「障害に強いメガ」「障害対応に強いメガ」の再構築に努めてまいります。
|