サーバーやネットワークの問題を専門家でもないに、私に聞かれても・・・
「プログラムはわかるけど、ネットワークなんてわからないよ」
「頼りにしてくれる嬉しいけど、サーバーなんてさわったことないって」
ネットワークにサーバーのトラブルが起こり
アクションをおこさなければなりません。
でも、「解決できれば、評価も上がるはずでは」と頭をよぎるかもしれませんし
いやいや、「苦労が増えるだけでしょう」と思われるかもしれません。
そうですよね。
そのとおりです。1回、2回では「苦労が増えるだけにしか思えません。」
中には便利屋としか思ってくれない上司もいるかもしれません。
でも、なんども何度でも解決すれば
「ほんと助かった、ありがとうな」と言ってくれる先輩が
「君がいて助かるよ」と言ってくれる上司がいるはずです。
信用を何度も重ねれば信頼に変わります。
しかし、トラブル解決の担当者ではいけません。
トラブル解決が仕事と勘違いしては評価されないのが現実です。
「問題解決は目的ではありません。」
事業活動を営んでいれば利益を上げなければなりません。
「ネットワークが遅い」を解決しても利益が上がるわけではなのですが、利益を損失するリスクを回避できるのです。
しかし「マイナス(損失)を防ぐ」は評価されず、「プラス(利益)」のみが評価される傾向があることは、私たちも実感しています。
お客様先の担当者様を見ていて「理不尽な」と思うこともあるのです。
苦労してトラブル解決しても、上司から「問題解決のアプローチが悪くないか」などと理不尽な言葉を聞くこともあります。
ここはめげないで
問題解決後には必ず、上司に・経営層に提案をしてみてください。
「障害に強いネットワーク環境を構築する」
「ネットワークトラブル調査パソコンを準備し対応マニュアルを作成する」などなど
「マイナス(損失)を防ぐことがプラス(利益)を生むことの土台となる」ことを念頭に提案してください。
こうすれば必ず評価されるはずです。
私たちは専門職でない方々に比べると経験がありますし、日々勉強もしています。
そんな私たちと問題を解決してみませんか。一緒に考えてみましょう。
「お電話ください。」の営業トークではありません。
では、「どうすれば解決できるのか・・」
問題とは
まず、考えなければいけないが「何が問題なのか」を把握することです。
問題とは
「理想と現実のギャップ」
「期待値と現状値のギャップ」
IT関連では「動いていて当たり前と動かないのギャップ」になります。
まずは、問題を5W2Hで書き出して下さい。
情報を整理するためにも、書かなければなりません。
1.何が問題なのか(What)
2.だれの問題なのか(Who)
3.どこで発生するのか(Where)
4.いつ発生するのか(When)
5.どのような状況で発生するのか(How)
6.いくら損失を発生させているのか(How much)
7.なぜ発生するのか(Why) ← ※これを突きとめるのです
一般的に
5W1Hは、「When:いつ」「Where:どこで」「Who:だれが」「What:何を」「Why:なぜ」「How:どのように」といった英単語の頭文字を取ったもので、「When:いつ」から始まりますが、
ここでは「What:何」から始まることが重要です。
事 例
製造会社にて、インターネットの検索に時間がかかったり社内サーバにアクセスできなくなったりするトラブルが発生しました。
パソコンを再起動すると治ることがあるで、エンドユーザーは当初、パソコン自体の問題ととらえていました。
しばらく様子をみると複数人にランダムに障害が発生するのです。
問題を整理
1.何が問題なのか(What)
⇒ 快適にアクセスできない のが問題です。
今まで「快適にアクセス出来ていた事」が「できなくなった」のです。
このギャップこそが問題です。
2.だれの問題なのか(Who)
⇒ 品質管理部の全ユーザー、調査をすすめると一部のユーザーですが
昨日はAさん、Bさん、Cさん
今日はCさん、Dさん、Eさん
他の部門では発生していない。
特定の部門ユーザーに絞り込めるのはラッキーです。
不特定なのは難問ですが、特定のパソコン本体の問題ではない事が確認できました。
3.どこで発生するのか(Where)
⇒ 品質管理部のネットワークのみ
他の部門では発生していない。
特定の部門に絞り込めるのはラッキーです。
4.いつ発生するのか(When)
⇒ Aさん:6日前ぐらいから Cさん:昨日から
一番古い日時を始まりとしましょう。「6日前ぐらいから」
5.どのような状況で発生するのか(How)
⇒ 特定の曜日や時間、特定の社内サーバ、特定のホームページなどで絞り込めません。
現時点では特定のトリガーは見当たりません。
このような場合、できる限り問題を細分化します。
細かくすると「解決できそうにない問題が、解決できそうな気分になっていくのです。」
6.いくら損失を発生させているのか(How much)
⇒ 部門内の3人ぐらい一日中、調子が悪い。(6日前から)
現段階で約39万円の損失
3人×8時間×6日×約2,700円=388,800円
※機器の交換や設備投資としなければならない場合、コスト損失の状況把握は重要です。
7.なぜ発生するのか(Why)
⇒ これを突きとめるのです。
問題の情報を整理しました。
さらなる調査
調査時に、現象が発生している機器(パソコン)を調べます。
ネットワーク状態の確認、コマンドプロンプト(ipconfig /all)
IPアドレス、サブネットマスク、ゲートウェイ、DNS情報が正常か確認します。
4台目に、おかしな情報を発見。
DNSの設定が社内サーバではなく、デフォルトゲートウェイのIPアドレスになっているのです。
よく確認すると、DHCPサーバのアドレス(192.168.155.72)も異なります。
お客様に監視用のパソコンを用意して頂き
「Wireshark」ネットワークプロトコルアナライザーでしばらく監視(bootpでフィルタ)すると
正常なDHCPサーバアドレス:192.168.155.10(赤枠)
と
管理外のDHCPサーバアドレス:192.168.155.72(青枠) を発見
IPアドレス192.168.155.172をネットワークスキャナーソフトで追いかけると
OSがWindows Serverの可能性が、確認すると検査機器管理用のサーバ(192.168.155.72)を見つけました。
原 因
品質管理部で新規導入や入れ替えた機器を確認すると、業者が1週間前にサーバを入れ替え、導入前にクローズネットワークでテストしていた際にDHCPサーバを利用していたのです。
そして運用ネットワーク接続時にDHCPサーバを有効にした状態で利用を開始しました。
対 応
検査機器管理用のサーバ(192.168.155.72)のDHCPサーバサービスを停止しました。
DHCPサーバが同じセグメントに、無管理状態で複数存在するのは問題です。
今後の防止策
今回は、サーバーの入れ替えで同じIPアドレスなので、社内申請書の提出がありませんでした。
再発防止の観点からも機器入れ替え時にも申請を必要とするルールに変更頂きました。
また、社内申請書における注意点に「DHCPサーバ機能の無効化」を追記。
今回の障害情報を社内掲示板で報告し周知徹底をお願いしました。
提案の例
原因調査用の「Wireshark」ネットワークプロトコルアナライザーなどを導入したパソコンを準備する。
ネットワーク障害時には強い味方になります。
※環境によっては、DHCPサーバの冗長化を行っている環境もありますので、DHCPサーバが複数台ある場合もあります。