System Monitoring Column <システム監視コラム>

Category: 監視設計編

2019.01.24

システム監視とは

システムが提供するサービスやインフラ基盤の問題点をいち早く発見するために、システム稼働状況を定期的に確認することです。
どの要素の、どの状態を「異常」として検知するかを定義し、異常検知時には、運用担当者へ通知します。

システム監視の目的

システム監視の目的は「インフラやサービスの障害をすばやく見つけること」です。
具体的に、下記2つの目的に分解して「何をどう監視するのか」を考えていきます。

(1)「サービスの正常性」を定期確認する:「サービスのシナリオ監視」

ビジネス機会を活かすためには「エンドユーザに正常にサービスを提供し続けること」が必要です。見積情報を取得するWebサイトを例に挙げると、

  • Webサイトへアクセスできること
  • 見積条件の入力、見積情報の取得などの一連の操作(シナリオ)を、正常に実行できること

が常に担保されている必要があり、どれかひとつでも処理に異常がある場合は、速やかに検知・復旧する必要があります。そのために、サービス(アプリケーション動作)をユーザ視点で定期監視する「シナリオ監視」を行います。

サービスのシナリオ監視
サービスのシナリオ監視

(2) 障害の「予防」と「原因特定」をする:「インフラ監視」

サービス継続のためには「障害の前兆を検知する予防」と「障害原因特定と再発防止」も必要です。

障害の前兆を検知する「予防」のための監視

例えば下図のような、Webサーバーが冗長化された構成のシステムにおいて、web1サーバーがダウンしたことを検知することは「予防」になります。

web1 と web2 のどちらかが稼働していれば Webサイト(https://example.com) へアクセス可能なため、直接的な影響は発生しません。しかし、web1サーバー、web2サーバーの両系で稼働していたシステムで web1 がダウンした場合、web2 は web1 の負荷も担わねばならず、web2 の負荷状況にサービス継続性が左右されてしまうことになります。

このように「現状ではサービスの継続はできているが、いつサービス停止(障害)になってもおかしくない状態」を迅速に検知するための監視が「予防のための監視」であり、サーバーやネットワークといったインフラを監視することで可能になります。

インフラ監視(予防)
インフラ監視(予防)

発生した障害の「原因特定」のための監視

一方で、冗長化していないDBサーバーである db1 がダウンした場合、WebサーバーとDBサーバーの連携が崩れることになり、Webサイト(https://example.com) にアクセスしてもエラー(障害)となります。

障害復旧のためには何が問題で障害が起きたのか、特定する必要があります。原因は、外部の回線なのか、内部の回線なのか、Webサーバーなのか、DBサーバーなのか、サーバで稼働するプロセスなのか、ハードウェア自体なのか、など。検証するべき要素は多くあります。
また、だいたいにおいて、障害は複数要素の複合的要因発生します。

システムを構成する要素の状態を監視しておけば、「障害につながる要素」「要素間の繋がり」がわかり、迅速な障害復旧が可能になります。

インフラ監視(原因特定)
インフラ監視(原因特定)

では、どこに監視ポイントを設定すれば、迅速な障害切り分けが可能になるのでしょうか?
次に、「システム監視項目をどう定義するのか」で監視ポイントの設計する際の考え方を見ていきます。

関連サービス

監視・障害対応サービス

24時間365日のシステム監視・障害対応を任せたい

障害発生時には、エンジニアが手順に基づく対応に加えて、技術的ノウハウに基づく対応を行い、サービスを復旧させます。また、障害の根本解決方法をご提案します。

大規模システム向け統合システム監視ツールPandora FMS Enterprise

大規模システム向け統合システム監視ツール Pandora FMS Enterprise

世界194か国から120万ダウンロード以上の支持を得るオープンソースの監視ツール Pandora FMSに、大規模システム向け機能を追加した Pandora FMS Enterprise。オープンソースベースの商用製品だから実現できる「運用コストの削減」と「使い勝手の良さ」が特徴です。

クラウド型監視ツール Pandora FMS Enterprise SaaS

クラウド型監視ツール Pandora FMS Enterprise SaaS

直感的で操作性に優れたサーバー監視ツールをSaaSでご提供。充実のサポートですぐに監視を開始できます。

Free

資料ダウンロード

課題解決に役立つ詳しいサービス資料はこちら

資料ダウンロード
  • システム運用代行サービスカタログ

    システム運用代行サービスのメニューと料金をご確認いただけます。

  • 運用設計が丸わかり!クラウド運用課題解決への4ステップ(運用設計ガイド)

    クラウド運用課題を解決する「運用設計の考え方」「運用設計のフレームワーク」のポイントを解説します。

  • 統合システム監視ツール Pandora FMS Enterprise カタログ

    直感的で操作性に優れたユーザインターフェイスを持ち、1つのシステムでマルチテナント環境を実現できる統合システム監視ツール Pandora FMS Enterprise、Pandora FMS Enterprise SaaS の機能、サポート内容、料金をご確認いただけます。

システム運用個別相談会(無料)

Tag: システム監視

Contactお問い合わせ

お見積もり・ご相談など、お気軽にお問い合わせください。

single.php