障害検知時に、監視エージェントもしくは監視サーバによる処理で、自動的にプロセス・サービスやインスタンスの再起動を行います。
以下は、当社指定の自動復旧対象のプロセス・サービスおよび、自動復旧判定基準です。お客様指定の監視項目(例:ログ監視のパターンマッチング)についても、別途監視の仕組みと連携するスクリプトを作成することで対応可能です。
「GCP監視・自動復旧プラン」をご利用いただくと、24時間365日の監視と、障害発生時のいち早いサービス復旧をアウトソースできます。
自動復旧対象プロセス・サービス
Linux OS
※「下記表は指でスライドさせてご覧いただけます。」監視項目 | 自動復旧対象 プロセス・サービス |
ポーリング周期 [sec] |
自動復旧判定基準 | |
---|---|---|---|---|
プロセス監視 (※1) |
プロセス存在監視 | vsftpd | 300 | 存在しない |
sshd | 300 | 存在しない | ||
postfix | 300 | 存在しない | ||
qmail | 300 | 存在しない | ||
named | 300 | 存在しない | ||
httpd | 300 | 存在しない | ||
dovecot | 300 | 存在しない | ||
mysqld | 300 | 存在しない | ||
postgresql | 300 | 存在しない | ||
プロセス応答監視 | ftp応答(vsftpd) | 300 | 5秒以上応答なし | |
ssh応答(sshd) | 300 | 5秒以上応答なし | ||
smtp応答(postfix) | 300 | 5秒以上応答なし | ||
smtp応答(qmail) | 300 | 5秒以上応答なし | ||
DNS応答(named) | 300 | 5秒以上応答なし | ||
http応答(httpd) | 300 | 5秒以上応答なし | ||
POP応答(dovecot) | 300 | 5秒以上応答なし | ||
MySQL応答(mysqld) | 300 | 5秒以上応答なし | ||
PostgreSQL応答 (postgresql) |
300 | 5秒以上応答なし |
(※1) 障害状態検知時に関連プロセスの再起動を実行する項目です。再起動を実施できるのは起動スクリプトが存在し、”service サービス名 restart” の実行が可能なものです。
Windows OS
※「下記表は指でスライドさせてご覧いただけます。」監視項目 | 自動復旧対象 プロセス・サービス |
ポーリング周期 [sec] |
自動復旧判定基準 | |
---|---|---|---|---|
プロセス監視 (※2) |
サービス存在監視 | イベントログサービス存在監視 Event Log |
300 | 停止状態 |
RPCサービス存在監視 Remote Procedure Call (RPC) |
300 | 停止状態 | ||
時刻同期サービス存在監視 Windows Time |
300 | 停止状態 | ||
IIS ベースサービス存在監視 IIS Admin Service |
300 | 停止状態 | ||
IIS Webサーバー関連サービス存在監視 World Wide Web Publishing Service |
300 | 停止状態 | ||
HTTPSサービス存在監視 HTTP SSL |
300 | 停止状態 | ||
IIS FTPサービス存在監視 FTP Publishing Service |
300 | 停止状態 | ||
MS SQL Serverサービス存在監視 MSSQLSERVER |
300 | 停止状態 | ||
SQLSERVERAGENTサービス存在監視 SQLSERVERAGENT |
300 | 停止状態 | ||
サービス応答監視 | http応答 (IIS) | 300 | 5秒以上応答なし |
(※2) Windowsのサービスマネージャから起動・停止できるものに限ります。
インスタンス
※「下記表は指でスライドさせてご覧いただけます。」監視項目 | 自動復旧(再起動) 対象 |
ポーリング周期 [sec] |
自動復旧判定基準 | |
---|---|---|---|---|
インスタンス状態監視 | GCPコンソール(API)上でのインスタンス状態 | AppService インスタンス | 300 | 停止状態 |
サービス応答監視 | http応答 | AppService インスタンス | 300 | 15秒以上応答なし |