UQの障害。

たまたま外にいる時間が短かったっていうのもあるのだけど、それほど不便な時間がなかった。時間に置き換えると4〜5時間使えなかったぐらい?まあ、メールは、イオンSIMがあるから見ることが出来るわけで、実害自体はかなり小さく抑えられたってところ。

で、勝手な解釈で障害について書いてみる。
無線をメイン回線に売り込んでてこう自体を起こすのはおかしいっていう人が居るけど、フレッツもルータ交換ミスってやったでしょ?OSPF実装だったかなぁ?ちょっと忘れたけど。まあ、障害って起こる物なんだよね、どんなに頑張っても。で、許していいのか?っていうとやっぱりよくなくて総務省にがんがん文句たれて「改善報告出してね」とかいわれないと直らないじゃないか?それでも、KDDI天下りなんかを大量に受け入れてるから致命的に怒られることはないからね。

でね、ちょこっとだけ運用なんて仕事をやっていた経験でこの話を勝手に解釈してみる。事故発生から復旧に20時間程度かかっている。第一報がUQから発表があったのは、障害発生から5時間後ぐらいとのこと。これが事実なら・・・・

  • UQの内部からネットワークの不具合が確認できなかった?
  • 障害切り分けとして障害との判断が出来なかった?
  • 単純に社内情報連携の不備?


ってところがポイントかなぁ?UQも前職でKDDIの法人営業部門が回線売りに来てたから適当な事はしないと思うだけどね。あとは、内部統制上、障害告知を発表できる権限を持っている人が居なかったとかつかまらなかったとか?ぐらいかなぁ?思いつくところで。

あと、復旧がITモバイルによると・・・・

サービスは22日8時頃に東京都多摩地区、埼玉県、神奈川県、山梨県で復旧、同日12時30分頃には東京都23区および23区外の一部を除き復旧したが、13時頃に23区と残っていた一部地域でも復旧した。


これBGPの障害なのか?対象機器が少ないところで早く直って行ったって感じがするね。正しいConfigを手打ちかなんかしてで一番対象台数が多いグループ、つまり23区が最後に復旧って感じか?

なお、発生原因については、現在調査中です。

センタールータが変なAS情報を流したのきっかけでつながらなくなったってことか。で、メーカー解析待ちってところかなぁ?このあたり、自分も仕事でちょっとだけ携わっていたけど、ホント大変なのよ。自分の担当範囲だったところ250台ぐらいしかルータはなかったけど変更とか足したり減らしたりは、神経使ったよ。当日、台風来てて情報入手が困難になった人もいたからだと思うけど、初動が悪いとどうしても印象悪いね。この障害切り分けの運用の見直しと初動体制の整備をやってくださいなってところかなぁ?

正しいかしらんんが思ったところ。あ、一個だけ気にくわないところがあった。障害起こしているのは、UQ WIMAXであってWIMAXではないって思ったな。と、いうことで報告が後日あると思うのだけど、少々楽しみ。