プロジェクト管理者の道具箱 トップページ
プロジェクト管理者の道具箱

障害管理

■障害管理の対象

  1. ハードウェア
  2. ソフトウェア
  3. ネットワーク
  4. アプリケーションプログラム

■障害管理の方法

  1. 障害の発生日時や発生場所は、原因追求や影響調査で必要になる為、把握しておく。
  2. どのような現象が発生しているのかを連絡者から詳細に聞き出す。
  3. エラーメッセージやエラーログ、データの状態等からシステムの状況を把握し、いつ、どこに、どのような影響があるのか確認する。
  4. 原因を特定し、業務が速やかに再開できるよう、暫定対応を施す。
  5. 本来あるべき状態になるよう、恒久対応を施す。
  6. 同様の障害を防止する為に関連箇所についても対応する。

■障害の原因

  1. ハードウェア障害
  2. ソフトウェアのバグ
  3. トランザクション量増加によるレスポンス低下
  4. 設計ミス
  5. プログラムミス
  6. プログラム改修によるデグレーション
  7. 入力データチェック漏れ
  8. テスト不十分
  9. プログラムバージョン不整合
  10. 環境設定ミス
  11. データの移行漏れ
  12. 移行手順ミス
  13. ジョブ運行制御のスケジュール登録ミス
  14. オペレーションミス
  15. ディスク容量オーバー
  16. データベースの制限オーバー
  17. ロック待ち
  18. デッドロック

■障害予防策

  1. 障害記録分析と改善対応
  2. 障害対策マニュアル
  3. 障害復旧手順書
  4. 障害復旧リハーサル
  5. 定期予防保守(ハードウェアの点検・ディスク容量・データベース容量等の定期チェック)
  6. ログの定期チェック
  7. 処理時間の定点観測
  8. セキュリティチェック
  9. 定期予防保守報告
  10. アプリケーションのバックアップ
  11. データのバックアップ
  12. クラスタリング構成
  13. ウィルス対策
  14. ソフトウェアのパッチ適用

■障害対応

  1. 関係者(利用者・管理者・経営者等)への運用停止連絡
  2. 障害状況(障害発生日時・障害発生場所・通報者・対象システム名・対象媒体・現象・影響範囲・環境・オペレーション等)の把握
  3. 被害状況(業務への影響等)の確認
  4. 被害拡大防止措置
  5. 関係者(利用者・管理者・経営者等)への中間報告
  6. 原因調査
  7. 暫定対応の検討と実施
  8. 関係者(利用者・管理者・経営者等)への運用再開連絡
  9. 恒久対応の検討と実施
  10. 再発防止策の検討と実施
  11. 障害記録
  12. 関係者(利用者・管理者・経営者等)への最終報告

■障害記録

  1. 障害管理番号
  2. 障害件名
  3. 障害区分(ハードウェア・ソフトウェア・ネットワーク・アプリケーション・運用・操作・他システム・災害等)
  4. 障害発生日時
  5. 障害発生場所
  6. 通報者(部門・氏名)
  7. 対象業務名
  8. 対象システム名
  9. 現象
  10. 操作手順
  11. 影響範囲(業務・顧客・部門・損害・損失)
  12. 対応者
  13. 対応人数
  14. 対応期間(開始時刻・終了時刻)
  15. 対応工数
  16. 直接原因
  17. 間接原因
  18. 根本原因
  19. 暫定対応
  20. 類似・周辺箇所への対応
  21. 恒久対応
  22. 承認
  23. 完了日



位置: トップ > システム管理 > 障害管理
通読: 前頁 | 次頁


Page Views

Update Information: RSS 2.0 (XML)
システム企画
プロジェクト管理
システム開発
システム管理

プロフィール
当サイトについて
サイトマップ
更新履歴
今後の予定
掲示板
QRコード




Creative Commons LicenseLink Free


このページの先頭へ