どうすれば解決できるのか

サーバーやネットワークの問題を専門家でもないに、私に聞かれても・・・

 

「プログラムはわかるけど、ネットワークなんてわからないよ」

「頼りにしてくれる嬉しいけど、サーバーなんてさわったことないって」

 

ネットワークにサーバーのトラブルが起こり
アクションをおこさなければなりません。

でも、「解決できれば、評価も上がるはずでは」と頭をよぎるかもしれませんし

いやいや、「苦労が増えるだけでしょう」と思われるかもしれません。

 

そうですよね。

そのとおりです。1回、2回では「苦労が増えるだけにしか思えません。」

中には便利屋としか思ってくれない上司もいるかもしれません。

 

でも、なんども何度でも解決すれば

「ほんと助かった、ありがとうな」と言ってくれる先輩が

「君がいて助かるよ」と言ってくれる上司がいるはずです。

信用を何度も重ねれば信頼に変わります。

 

しかし、トラブル解決の担当者ではいけません。

トラブル解決が仕事と勘違いしては評価されないのが現実です。

 

「問題解決は目的ではありません。」

事業活動を営んでいれば利益を上げなければなりません。

「ネットワークが遅い」を解決しても利益が上がるわけではなのですが、利益を損失するリスクを回避できるのです。

しかし「マイナス(損失)を防ぐ」は評価されず、「プラス(利益)」のみが評価される傾向があることは、私たちも実感しています。

お客様先の担当者様を見ていて「理不尽な」と思うこともあるのです。

苦労してトラブル解決しても、上司から「問題解決のアプローチが悪くないか」などと理不尽な言葉を聞くこともあります。

ここはめげないで

問題解決後には必ず、上司に・経営層に提案をしてみてください。

「障害に強いネットワーク環境を構築する」

「ネットワークトラブル調査パソコンを準備し対応マニュアルを作成する」などなど

 

「マイナス(損失)を防ぐことがプラス(利益)を生むことの土台となる」ことを念頭に提案してください。

こうすれば必ず評価されるはずです。

 


 

私たちは専門職でない方々に比べると経験がありますし、日々勉強もしています。

そんな私たちと問題を解決してみませんか。一緒に考えてみましょう。

「お電話ください。」の営業トークではありません。

 

では、「どうすれば解決できるのか・・」

 

問題とは

まず、考えなければいけないが「何が問題なのか」を把握することです。

 

問題とは

「理想と現実のギャップ」

「期待値と現状値のギャップ」

IT関連では「動いていて当たり前と動かないのギャップ」になります。

 

理想と現実のギャップ

 

まずは、問題を5W2Hで書き出して下さい

情報を整理するためにも、書かなければなりません。

 

1.何が問題なのか(What)

2.だれの問題なのか(Who)

3.どこで発生するのか(Where)

4.いつ発生するのか(When)

5.どのような状況で発生するのか(How)

6.いくら損失を発生させているのか(How much)

7.なぜ発生するのか(Why)  ← ※これを突きとめるのです

 

一般的に

5W1Hは、「When:いつ」「Where:どこで」「Who:だれが」「What:何を」「Why:なぜ」「How:どのように」といった英単語の頭文字を取ったもので、「When:いつ」から始まりますが、

ここでは「What:何」から始まることが重要です。

 

事 例

 

製造会社にて、インターネットの検索に時間がかかったり社内サーバにアクセスできなくなったりするトラブルが発生しました。

パソコンを再起動すると治ることがあるで、エンドユーザーは当初、パソコン自体の問題ととらえていました。
しばらく様子をみると複数人にランダムに障害が発生するのです。

 

問題を整理

 

1.何が問題なのか(What)

⇒ 快適にアクセスできない のが問題です。

今まで「快適にアクセス出来ていた事」が「できなくなった」のです。

このギャップこそが問題です。

 

2.だれの問題なのか(Who)

⇒ 品質管理部の全ユーザー、調査をすすめると一部のユーザーですが

昨日はAさん、Bさん、Cさん

今日はCさん、Dさん、Eさん

他の部門では発生していない。

特定の部門ユーザーに絞り込めるのはラッキーです。

不特定なのは難問ですが、特定のパソコン本体の問題ではない事が確認できました。

 

3.どこで発生するのか(Where)

⇒ 品質管理部のネットワークのみ

他の部門では発生していない。

特定の部門に絞り込めるのはラッキーです。

 

4.いつ発生するのか(When)

⇒ Aさん:6日前ぐらいから Cさん:昨日から

一番古い日時を始まりとしましょう。「6日前ぐらいから」

 

5.どのような状況で発生するのか(How)

⇒ 特定の曜日や時間、特定の社内サーバ、特定のホームページなどで絞り込めません。

現時点では特定のトリガーは見当たりません。

このような場合、できる限り問題を細分化します。

細かくすると「解決できそうにない問題が、解決できそうな気分になっていくのです。」

 

6.いくら損失を発生させているのか(How much)

⇒ 部門内の3人ぐらい一日中、調子が悪い。(6日前から)

現段階で約39万円の損失

3人×8時間×6日×約2,700円=388,800円

※機器の交換や設備投資としなければならない場合、コスト損失の状況把握は重要です。

 

7.なぜ発生するのか(Why)

⇒ これを突きとめるのです。

 

問題の情報を整理しました。


 

さらなる調査

 

調査時に、現象が発生している機器(パソコン)を調べます。

ネットワーク状態の確認、コマンドプロンプト(ipconfig /all)

 

IPアドレス、サブネットマスク、ゲートウェイ、DNS情報が正常か確認します。

4台目に、おかしな情報を発見。

DNSの設定が社内サーバではなく、デフォルトゲートウェイのIPアドレスになっているのです。

よく確認すると、DHCPサーバのアドレス(192.168.155.72)も異なります。

 

お客様に監視用のパソコンを用意して頂き

「Wireshark」ネットワークプロトコルアナライザーでしばらく監視(bootpでフィルタ)すると

 

wireshark dhpcサーバ検索

 

正常なDHCPサーバアドレス:192.168.155.10(赤枠)
 と 
管理外のDHCPサーバアドレス:192.168.155.72(青枠) を発見

 

IPアドレス192.168.155.172をネットワークスキャナーソフトで追いかけると

OSがWindows Serverの可能性が、確認すると検査機器管理用のサーバ(192.168.155.72)を見つけました。

 

原 因

 

品質管理部で新規導入や入れ替えた機器を確認すると、業者が1週間前にサーバを入れ替え、導入前にクローズネットワークでテストしていた際にDHCPサーバを利用していたのです。

そして運用ネットワーク接続時にDHCPサーバを有効にした状態で利用を開始しました。

 

 

対 応

検査機器管理用のサーバ(192.168.155.72)のDHCPサーバサービスを停止しました。

DHCPサーバが同じセグメントに、無管理状態で複数存在するのは問題です。

 

 

今後の防止策

今回は、サーバーの入れ替えで同じIPアドレスなので、社内申請書の提出がありませんでした。

再発防止の観点からも機器入れ替え時にも申請を必要とするルールに変更頂きました。

また、社内申請書における注意点に「DHCPサーバ機能の無効化」を追記。

今回の障害情報を社内掲示板で報告し周知徹底をお願いしました。

 

提案の例

原因調査用の「Wireshark」ネットワークプロトコルアナライザーなどを導入したパソコンを準備する。
ネットワーク障害時には強い味方になります。

 

※環境によっては、DHCPサーバの冗長化を行っている環境もありますので、DHCPサーバが複数台ある場合もあります。