ITインフラあるある物語

ITインフラエンジニアがよく陥りがちなトラブルをまとめてみました。
PC編
エンドユーザ「ネットワーク繋がらないんだけど!」
LANケーブル抜けかかってますよ。ていうか爪の折れたケーブル使うのやめてくださいね。
エンドユーザ「なんか動かないんだけど!」
どういうエラーが出ているのか、何をしたらそうなったのか、いつまで正常だったのか、きちんと説明して下さい。
エンドユーザ「お茶こぼしたら壊れた。保証効く?」
壊れたのではなく、アナタが壊したのです。保証はききません。
エンドユーザ「ノートの液晶が何もしないのに割れた!」
砂漠にでも放置しない限り、何もしないのに割れることはないと思います。あと、その割れ方、ノートの間にマウス挟んで移動しましたね?
エンドユーザ「メモリ追加したら動かない! なんとかして!」
その「剥がしたら保証なくなるよ」シール見えないんですか。相談もなく背面パネル開ないで。
エンドユーザからソフトウェアの不具合連絡。行ってみると。
エンジニアが行くと事象が再現しません。たぶん、PCに小人さんかなんかが住んでいて、PCが好きな人と嫌いな人を見分けてるんだと思います。
サーバ編
なんか不安定なんでとりあえず再起動しよう
Windowsサーバーにて。Linuxではなかなか信じがたい行動パターン。ブラックボックスが多過ぎなんですよ、たぶん。
サーバ壊れたんでバックアップから復旧しよう! アレ?
計画通り取られてたはずのバックアップがそこになく、絶望。バックアップの監視もキッチリやりましょう。
サーバ不調なんでリモートで接続しよう! アレ?
運用ポートって監視怠りがちですよね。これに懲りたらテスト計画ちゃんと作りましょう。
サーバ不調なんで、リモートコンソール接続しよう! アレ? パスワードが?
キーボードのタイプちゃんと確認しました? コンソールが英語だと、パスワードの記号でしにますよ。これに懲りたら運用テストちゃんとやりましょう。
冗長化してたはずなのになんでサービス落ちるの?
副系の監視怠ってましたね? これに懲りたらテスト計画ちゃんと立てましょう。
ストレージが突然死んだ!
あー、ディスク複数本死んでますね。監視ちゃんと入れてました? これに懲りたらテスト計画ちゃんと立てましょう。
ストレージが突然死んだ!
スナップショットの容量、考慮に入れてましたか? これに懲りたらキャパシティ計画ちゃんとしましょう。
ストレージが突然スローダウン!
あー、ディスク複数本死んでますね。監視ちゃんと入れてました? とりあえず死ななくてよかったです。これに懲りたらテスト計画ちゃんと立てましょう。
ストレージが突然スローダウン!
RAIDの電池が切れてRAIDのReadキャッシュが効かなくなるとか、よくありますね。つーかどういうハード設計なんだよ。
ネットワーク編
エンドユーザ「島HUB配下がまるごと死んだ!」
ケーブルいじったでしょ。上位ポートでループ検出されてますよ。
冗長化してたはずなのになんでサービス落ちるの?
サーバーと同じです。副系の監視怠ってましたね? これに懲りたらテスト計画ちゃんと立てましょう。
新規の回線が遅い! 不安定!
キャリア側は固定で、顧客側はAutoじゃないですか。インターフェイスのステータスが100halfとかですよね。
リンクアップしない! どうして?
LANケーブルは「パチッ」と音がするまで差し込むのが基本です。あと光ケーブルは折れやすいのでそんなに曲げちゃダメですよ。
リンクアップしない! どうして?
つ 「no shutdown」。繋いでるポートをきちんと確認しましょう。
コンソールが文字化けする!どうして?
落ち着いて、機器のコンソール仕様を確認しましょう。9600bps、Xが全てとは限りません。
他業者がサーバ入れ替えたら、ネットワーク繋がらなくなった!
まず、そのスパゲティのようなLAN配線なんとかしたほうがいいですよ。業者がかわいそうなんで。
床下這わせてるLANの行き先がどこか分からない!
配線図ちゃんと作りましょう。あと、コネクタにはタグ付けしましょう。
※思い出したら随時追記していきます。
2020/09/14