Service&Product

AWS監視・自動復旧プラン

AWS監視、障害通知に加えて、監視の仕組みによる自動障害対応を行うプランです。

24時間365日 監視を行い、障害を検出した際には、監視エージェントまたは監視サーバーによる処理で、迅速にプロセス・サービスやインスタンスの自動再起動を行います。またお客様への障害通知は、メール、Slack、ChatWork、LINE、自動音声電話通知で行います。

24時間365日の AWS 監視をアウトソースし、障害発生時にもいち早くサービス復旧させたい場合に最適です。

AWS監視・自動復旧プラン ご提供内容

  • AWS 24時間365日の監視

    24時間365日の監視

  • AWS監視 お客様専用の監視環境

    お客様専用の監視環境

  • AWS監視インターバル

    監視インターバル

  • AWS自動障害通知

    自動障害通知
    通知先は複数でもOK

  • 監視コンソール+ポータルサイト

    監視コンソール+
    ポータルサイト

  • AWS障害自動復旧

    障害自動復旧

  • AWS前月分の稼働状況レポート

    前月分の稼働状況
    レポート

インスタンスの監視・情報収集

  • 監視対象のインスタンスにソフトウエアエージェントをインストールし、情報送信先を監視サーバーに設定するだけで、インスタンスのディスク使用量やロードアベレージ・ネットワーク使用量等の収集を開始します。
  • 仮想サーバー以外のインスタンスに対しても監視サーバーから AWS のAPI経由で情報を収集することができます。
  • 監視しきい値を設定し、閾値を超えたときにメールを送るように設定すれば、障害通知を受信できます。
  • オプションとしてインターネットを経由しないネットワーク接続(専用線やIP-VPNなど)をご用意することも可能です。ご要望をお聞かせください。

※ 表中に記載した内容は、代表的な項目を例として挙げております。お客様のシステムに応じて最適な監視項目をご提案いたします。

監視対象 監視概要
EC2
(仮想サーバーホスティング)
CPUやメモリといったリソース使用量や、各インスタンスで稼働するプロセスの存在監視、応答監視を行います。
また AWS API経由でインスタンスステータスやメンテナンス予告を監視します。 定期バックアップを行っている場合は、バックアップ正常性を監視します。
RDS/Aurora
(リレーショナルデータベースサービス)
エンドポイントに対して、DB接続やSQLクエリ応答を監視します。
AWS API経由でクラスタ(インスタンス)ステータス、フェイルオーバー発生などのイベント、メンテナンス予告を監視します。
また、コネクション数やCPUなどのCloudWatchメトリクスを監視します。
ALB/NLB/CLB
(ロードバランサー)
正常なターゲット(ロードバランサー配下のインスタンス)の数、及び、コネクション数やHTTP応答コード数などのCloudWatchメトリクスを監視します。
S3
(ストレージサービス)
AWS API経由でファイルリスト取得可否、ファイル取得可否、ストレージ使用量を監視します。
SES
(メールサービス)
定期的にテストメールを送信し、メール受信を確認します。
また、バウンス率、苦情率などのCloudWatchメトリクスを監視します。
CloudFront
(コンテンツ配信ネットワークサービス)
リクエスト数、HTTP応答コードのエラー率、キャッシュヒット率(AWS側で追加設定が必要)などのCloudWatchメトリクスを監視します。
ElasticCache (Memcached/Redis)
(インメモリキャッシングシステム)
AWS API経由でクラスタステータス、ノード障害発生と復旧ログやメンテナンスなどのイベントを監視します。
また、コネクション数やCPUやスワップ使用率などのCloudWatchメトリクスを監視します。
SQS
(メッセージキューイングサービス)
キューに追加されたメッセージ数、削除されたメッセージ数、取得可能なメッセージ数、及び、最も古いメッセージの経過時間などのCloudWatchメトリクスを監視します。
Redshift
(クラウドデータウェアハウス)
AWS API経由でクラスタステータス、ノード障害発生と復旧ログやメンテナンスなどのイベントを監視します。
また、コネクション数やCPUやクエリ完了時間などのCloudWatchメトリクスを監視します。
Beanstalk
(アプリケーションデプロイサービス)
AWS API経由で環境のヘルスステータスを監視します。
正常なターゲット(ロードバランサー配下のインスタンス)の数、及び、コネクション数やHTTP応答コード数などのCloudWatchメトリクスを監視します。
ECS
(コンテナオーケストレーションサービス)
サービス内で実行中のタスク数、及び、クラスタやサービスのCPUやメモリなどのCloudWatchメトリクスを監視します。
EFS
 (EC2用ファイルサービス)
マウントされているEC2インスタンスから、EFS パーティションに対して読み書き出来るかを監視します。
DynamoDB
 (NoSQLデータベースサービス)
HTTP応答コードのエラー数、及び、消費キャパシティユニット(読み書き使用量)やレイテンシーなどのCloudWatchメトリクスを監視します。
Directory service(SimpleAD/Maneged Microsoft AD)
 (AWS Directory サービス)
AWS API経由で、ディレクトリのステータスを監視します。
Lambda
 (サーバーレスコンピューティングサービス)
呼び出し回数、実行時間、正常終了しなかった回数などのCloudWatchメトリクスを監視します。
トリガがAPI Gatewayの場合は外形監視を行います。
アプリケーションログがCloudWatch Logsに出力されている場合はログ監視を行います。
API Gateway 外形監視として、応答コードや応答時間を監視します。
VPN トンネルの Up/Down を監視します。

監視項目と監視手法

  • 障害を検知すると、自動電話、メール、チャットにより通知いたします。
  • チケットシステムへインシデントを自動起票いたします。
監視項目 監視対象 監視手法 監視間隔
プロセス存在監視 プロセスが存在しているかを監視 該当プロセスが存在しているかを監視します。 5分
※変更可能
プロセス応答監視 プロセスが応答するかを監視 監視サーバから該当プロセスへの接続を行い5秒以内に応答するかを監視します。 5分
※変更可能
サービス存在監視 サービスが存在しているかを監視 サービスが存在しているかを監視します。 5分
※変更可能
サービス応答監視 サービスが応答するかを監視 監視サーバから該当サービスへの接続を行い5秒以内に応答するかを監視します。 5分
※変更可能
リソース監視 サーバー機器のリソース監視 CPUやメモリといったリソース使用量の監視を行います。 5分
※変更可能
ログ監視 Windows イベントログ ログの名前、イベントソース、イベントID、レベル、ID、メッセージの正規表現等の条件をもとに抽出します。 5分
※変更可能
テキストベースのログファイル ログファイルの増分から任意の文字列(Error , Warning 等)を含む行を抽出します。
/var/log 以下のファイル
syslogが出力するファイル
アプリケーション独自のログファイル等
ジョブ監視 ジョブの実行結果 ジョブ終了時のアクションに、ジョブの実行結果を弊社監視環境へ通知します。 イベント発生時
PING 応答監視 応答の有無、応答時間 ping にて対象の応答を確認します。 5分
※変更可能
WEB サービス応答監視 応答コード、応答時間、応答内文字列チェック http または https 接続要求を送り、対象の応答を確認します。
SSL証明書期限監視 サーバー証明書の有効期間満了日までの期間 https接続にて証明書を取得し、残り期間を計算します。
FTP サービス稼働監視 ファイル取得可否、ファイル保存可否、ファイルリスト確認、応答時間確認 ftp にて要求を送り、対象の応答を確認します。
メールサービス稼働監視 メール送受信、接続確認、応答時間確認 各種メール関連プロトコル(imap, pop, smtp)で対象への応答を確認します。
DB応答監視 DB接続、SQLクエリ応答 各DB(MySQL,PostgreSQL,MSSQL)へ接続し、接続自体の可否確認および、SQLクエリを実行してその応答を確認します。
インスタンス稼働状態監視 インスタンスの稼働状態 ping疎通および、AWS APIを通してのインスタンスの稼働ステータスの取得します。

自動復旧させる項目

  • 障害を検知すると、復旧スクリプトによる該当サービスの再起動、または、復旧スクリプトによる対象インスタンスの再起動を行います。

当社指定の監視項目

  • 死活監視(ping による疎通監視)
  • リソース監視(CPU使用率、メモリ使用率、ディスク使用率)
  • プロセス存在監視(httpd , vsftpd , sshd, postfix, qmail  等)
  • プロセス応答監視(http応答、ftp応答、ssh応答、smtp応答 等)
  • サービス存在監視(イベントログサービス存在、IIS Webサーバー関連サービス存在 等)
  • サービス応答監視(http応答 (IIS)、https応答 (IIS) 等)

お客様指定の監視項目

当社指定項目以外で自動復旧を行いたい場合(例:ログ監視のパターンマッチング等)は、別途有償にて、監視設定と復旧スクリプトを作成します。

障害通知方法

メールや Slack、ChatWork、LINE への障害通知の他に、自動電話通知機能もご利用いただけます。

・障害が発生した「機器名」と「日時」を、音声にて通知します。
・連絡先として登録されている電話番号に対し、停止処理が実行されるまで、順番に電話をかけ続けます。
(誰かが出るまで電話しつづけて欲しい、というご要望にも対応できます)

障害発生時の自動電話連絡 障害発生時の自動電話連絡

監視コンソール+ポータルサイト

お客様専用の監視コンソールおよびポータルサイトをご提供します。
システムの稼働状況を確認できるほか、システム運用に関する様々な情報項目を集約することで、効率的な情報共有を実現します。

集約・更新・共有する情報

  • 1システムの稼働状況

    監視コンソールから、システム稼働状況をリアルタイムに確認・共有できます。

    • 監視対象の稼働状況
    • リソース情報(数値データおよびグラフ表示)
    • アラート発報告状況
  • 2稼働状況レポート

    前月分の対象インスタンスのリソース推移をグラフ化し、運用ポータルにPDFで掲載いたします。

料金

※表記金額は、全て税抜金額です。

内容 ご提供時間 初期費用 月額費用
AWS監視・自動復旧 24時間365日 10,000円/インスタンス 10,000円/インスタンス
リソース推移レポート(PDF) 翌月初 無料 無料

・初期費用について、当社指定項目以外で復旧設定スクリプトを作成する場合は、1スクリプトあたり15,000円をいただきます。

AWS運用代行サービスメニュー
  • アールワークスは、AWSコンサルティングパートナーです。
  • 徹底的な標準化と自動化で高品質の運用を低コストでご提供します。
  • 1997年から蓄積した運用ノウハウをもとに+αをご提案します。
Free

資料ダウンロード

課題解決に役立つ詳しいサービス資料はこちら

資料ダウンロード
  • システム提案依頼書-非機能要件編-(サンプル)

    システム運用業務をアウトソースする際の、提案依頼書(RFP)サンプルをご確認いただけます。

  • システム監視・自動復旧サービス仕様書

    システム監視・自動復旧サービスのサービス仕様をご確認いただけます。

Contactお問い合わせ

お見積もり・ご相談など、お気軽にお問い合わせください。