システム監視、障害通知に加えて、エンジニアが障害対応を行うプランです。
当社にて障害対応手順書を作成します。24時間365日のシステム監視を行います。障害発生時には、エンジニアが手順に基づく対応に加えて、技術的ノウハウに基づく対応も行い、サービスを復旧させます。
エンジニアによる、迅速かつ手厚い障害対応をご要望の場合に最適です。
システム監視・障害対応プラン ご提供内容
-
24時間365日体制
-
システム監視
-
手順書対応
-
手順書外対応
-
障害根本解決策のご提示
-
障害対応レベルに応じた
関係者との連絡・調整 -
前月分の稼働状況レポート
前月分の障害報告・
運用代行一覧 -
ベンダコントロール
-
マルチベンダ・
マルチロケーション
監視対象レイヤ(機器)
監視項目と監視手法
- 監視対象にエージェントをインストールするエージェント型、監視サーバーから SNMP や WMI を使って情報を取得・収集するエージェントレス型の双方に対応できます。
- 障害を検知すると、自動電話、メール、チャットにより通知いたします。
- 障害一次対応を行います(復旧スクリプトによる該当プロセスやサービスの再起動、復旧スクリプトによる対象インスタンスの再起動、 エンジニアによる障害一次対応)。
- チケットシステムへインシデントを自動起票いたします。
- オプションによる障害二次対応、現地対応も承ります。
- オプションとしてインターネットを経由しないネットワーク接続(専用線やIP-VPNなど)をご用意することも可能です。ご要望をお聞かせください。
※ 表中に記載した内容は、代表的な項目を例として挙げております。お客様のシステムに応じて最適な監視項目をご提案いたします。
監視項目 | 監視対象 | 監視手法 | 監視間隔 |
---|---|---|---|
プロセス存在監視 | プロセスが存在しているかを監視 | 該当プロセスが存在しているかを監視します。 | 5分 ※変更可能 |
プロセス応答監視 | プロセスが応答するかを監視 | 監視サーバから該当プロセスへの接続を行い5秒以内に応答するかを監視します。 | 5分 ※変更可能 |
サービス存在監視 | サービスが存在しているかを監視 | サービスが存在しているかを監視します。 | 5分 ※変更可能 |
サービス応答監視 | サービスが応答するかを監視 | 監視サーバから該当サービスへの接続を行い5秒以内に応答するかを監視します。 | 5分 ※変更可能 |
リソース監視 | サーバー機器のリソース監視 | CPUやメモリといったリソース使用量の監視を行います。 | 5分 ※変更可能 |
ログ監視 | Windows イベントログ | ログの名前、イベントソース、イベントID、レベル、ID、メッセージの正規表現等の条件をもとに抽出します。 | 5分 ※変更可能 |
テキストベースのログファイル | ログファイルの増分から任意の文字列(Error , Warning 等)を含む行を抽出します。 | ||
/var/log 以下のファイル | |||
syslogが出力するファイル | |||
アプリケーション独自のログファイル等 | |||
サーバーハードウエア監視 | 死活監視(ICMP ECHO)、CPUの状態・温度、メモリ状態・シングルビットエラー発生数、RAIDカードのバッテリー、物理ストレージの状態・障害予兆、論理ストレージの状態、ファン回転数、筐体内温度、電源状態・電圧、等 | 対象機器のベンダが公開しているツールから抽出、SNMP 経由で情報収集、IPMI経由で情報収集、等 | 5分 ※変更可能 |
エラー通知メールの受信、SNMP Trap受信、等 | イベント発生時 | ||
ネットワーク機器監視 | CPUの状態・使用率、メモリ使用率、ポート単位でのトラフィック、電源状態、冗長状態、等 | 対象機器のベンダが公開しているツールから抽出、SNMP 経由で情報収集、IPMI経由で情報収集、等 | 5分 ※変更可能 |
エラー通知メールの受信、SNMP Trap受信、等 | イベント発生時 | ||
VMwareホスト監視 (仮想マシン監視) |
VMwareホストで利用されるリソース | vCenter の Web コンソールから情報収集します。 | 5分 ※変更可能 |
ジョブ監視 | ジョブの実行結果 | ジョブ終了時のアクションに、ジョブの実行結果を弊社監視環境へ通知します。 | イベント発生時 |
PING 応答監視 | 応答の有無、応答時間 | ping にて対象の応答を確認します。 | 5分 ※変更可能 |
WEB サービス応答監視 | 応答コード、応答時間、応答内文字列チェック | http または https 接続要求を送り、対象の応答を確認します。 | |
SSL証明書期限監視 | サーバー証明書の有効期間満了日までの期間 | https接続にて証明書を取得し、残り期間を計算します。 | |
FTP サービス稼働監視 | ファイル取得可否、ファイル保存可否、ファイルリスト確認、応答時間確認 | ftp にて要求を送り、対象の応答を確認します。 | |
メールサービス稼働監視 | メール送受信、接続確認、応答時間確認 | 各種メール関連プロトコル(imap, pop, smtp)で対象への応答を確認します。 | |
DB応答監視 | DB接続、SQLクエリ応答 | 各DB(MySQL,PostgreSQL,MSSQL)へ接続し、接続自体の可否確認および、SQLクエリを実行してその応答を確認します。 | |
クラウド連携プラグイン監視 | 各種クラウドサービス上で稼働するインスタンス | 各サービスで提供している API を利用します。 |
障害通知方法
メールや Slack、ChatWork、LINE への障害通知の他に、自動音声電話通知機能もご利用いただけます。
・障害が発生した「機器名」と「日時」を、音声にて通知します。
・連絡先として登録されている電話番号に対し、停止処理が実行されるまで、順番に電話をかけ続けます。
(誰かが出るまで電話しつづけて欲しい、というご要望にも対応できます)
・お電話による障害通知のみを、当社エンジニアが行うサービスは提供しておりません。
障害発生から対応完了までの流れ
障害対応における行動目標
障害発生時における障害の検出、解析、対応、報告に対する対応時間は、下記値を目標とします。
工程 | 概要 | 対応時間 | 行動目標 |
---|---|---|---|
障害発生~障害検知 | 監視システムが障害を検知しアラートメールを送信します。 | 24時間365日 | 監視周期による |
ベンダ、キャリアの監視にて障害を検知し、当社宛てに一報を頂きます。 | ベンダサポート時間による | ||
障害検知~障害認知・対応開始 | 監視システムからの障害通知を認知し、対応を開始します。 | 24時間365日 | 10分以内 |
ベンダ、キャリアからの一報にて対応を開始します。 | |||
状況確認~連絡 | 障害内容の確認を行い、所定の連絡先にエスカレーションを実施します。 | 24時間365日 | 対応における確認内容による |
障害対応 | 手順書に基づき障害対応を実施します。 | 24時間365日 | – |
復旧確認 | アラート復旧メール受信などで、障害の復旧を確認し、お客様へ報告する。 | 24時間365日 | 復旧後、5分以内 |
お客様専用の「監視コンソール」と「ポータルサイト」
お客様専用の監視コンソールおよびポータルサイトをご提供します。
システムの稼働状況を確認できるほか、システム運用に関する様々な情報項目を集約することで、効率的な情報共有を実現します。
集約・更新・共有する情報
-
1システムの稼働状況
監視コンソールから、システム稼働状況をリアルタイムに確認・共有できます。
- 監視対象の稼働状況
- リソース情報(数値データおよびグラフ表示)
- アラート発報告状況
-
2インシデント管理・
障害管理ポータルサイトでインシデントをチケット化、共有し、クローズまで進捗管理します。
- お客様からの問合せ内容
- 発生した障害
- 障害対応内容
- 根本解決に向けたベンダ(開発元メーカ)への問合せ・検証作業
-
3障害対応手順
障害対応手順をポータルサイトで共有し、お客様と当社間で同じ認識のもと障害対応いたします。
- 監視項目毎の障害対応手順
- 手順外の障害が発生した場合は、当社にて手順書を作成しアップ
-
4稼働状況レポート
障害報告レポート月初、前月分の下記をレポートにし、運用ポータルサイトに掲載いたします。
- 前月分の対象インスタンスのリソース推移グラフ
- 前月に発生した障害一覧
-
5運用作業管理
ご依頼いただいた運用作業をポータルサイトでチケット化し、お客様と共有しながら進捗管理いたします。
料金
※表記金額は、全て税抜金額です。
内容 | ご提供時間 | 初期費用 | 月額費用 |
---|---|---|---|
システム監視・障害対応 運用手順書作成 |
24時間365日 | 125,000円 (2台目以降、 +5,000円/台) |
20,000円/台 |
リソース推移レポート 障害報告・運用代行内容一覧 |
翌月初 | 無料 | 無料 |
Contactお問い合わせ
お見積もり・ご相談など、お気軽にお問い合わせください。