Managed Service Column <システム運用コラム>

運用設計の考え方と取り組み事例

Category: 運用設計編

2021.02.09

システムのクラウド移行が加速する中、「クラウドサービスを活用しているが、クラウド毎に個別に監視・運用をしているため、運用が煩雑化している。どうすればよいか?」「オンプレミスとクラウドを併用することになり、運用管理体制を見直したい」といったお声をいただくことも多くなりました。

システムは構築して終わりではなく、安定稼働するための運用が重要です。そして、システム運用の品質を担保しながら効率を上げていくためには、運用設計が必要となります。

この連載では、運用設計の考え方やの取り組みについて、事例も交えて紹介します(全12回)

はじめに

今回から、運用体制構築するための前提である「何を、どう管理するのか」について説明していきます。ここでは「サービスレベル管理」について、取り組み事例(当社の場合)も交えてご紹介します。

サービスレベル管理とは

目的

サービスレベル管理の目的は、システムが達成すべきサービスレベルを、サービス提供側とサービス利用側とで事前に定義・合意し、常にサービスレベルが満たされるよう管理することです。

サービスレベル管理を行うことによって、サービス提供側においては障害に費やす時間や労力を削減(低減)でき、サービス利用者側においては自社事業や業務の中断を削減(低減)することができます。
このプロセスを遂行することで、サービスの改善や顧客満足度の向上に繋がります。

何を行うのか

サービスレベル管理は、提供されるサービスのレベルを定義、文書化し、サービス提供者とサービス利用者間で合意し、その内容をモニタリングし結果をレビューし発見した問題を是正するプロセスです。
ITILでは下記のように記載されています(OLA については当社加筆)。

1.SLR(サービスレベル要件)の決定、文書化、合意

事業達成目標に基づいて定義される、ITサービスに対する顧客の要件を整理します。

2.SLA・OLAの作成

ITサービス提供者と顧客との間で、サービス利用に関する合意を締結します。

SLA(Service Level Agreement)とは、「提供するITサービスの内容(範囲)」「サービス時間」「サービスの可用性」「信頼性」「サポート期間」などについて、顧客とITサービス提供者との間で交わされる合意です。サービスレベルの目標値を文書化し、ITサービス提供者及び顧客の責任を規定します。

OLA(Operation Level Agreement)とは、SLAを実現するためにITサービス提供者の内部で締結される合意です。サービス利用者に対するITサービスのサポートやデリバリに関する責任範囲、障害発生時の活動・措置を定義します。サポートプロセスの各要素(実際のサポート業務)における基準値や目標値を含みます。SLAの下位にあり、次項で述べる UC とともにSLAの裏付けとなるものです。

3.外部委託契約(UC)

SLAを実現するために、ITサービス提供者と外部サプライヤーとの間で締結される合意です。サービスレベルを維持するために、通常、ITサービス提供者は外部のサプライヤーと連携して活動することがほとんどだからです。

4.SLAに照らしたサービスのパフォーマンスの監視

SLAの目標値を満たしているか、サービスのパフォーマンスを監視します。 SLAは、監視や測定できる項目で構成するのがポイントです。

5.サービス・レビュー

ITサービス提供者とサービス利用者とで、モニタリング結果のレビューと課題の洗い出しを行います。

6.サービス改善計画(SIP)

サービス・レビューで洗い出した課題の改善計画を立て、是正していきます。

サービスレベル管理の取り組み事例

サービス管理の取り組み事例として、当社の例を挙げてご紹介していきます。自社で取り組む際の参考になれば幸いです。

当社は、24時間365日のシステム運用サービスとクラウド構築サービス、クラウド型監視サービスをご提供しています。 当社サービスのレベルが満たされていることを保証するために、サービス基盤の管理、オペレーション管理、社内リソースの管理、外部委託先の管理、インシデント管理が目標通り行われているかを管理しています。

サービス基盤の管理

24時間365日の安定的な監視・障害対応サービスをご提供するため、当社サービス提供基盤は24時間365日の稼働を必須条件として構成されています。 この条件を満たすため基盤の冗長構成ならびに故障時のリカバリ体制を整えるとともに、発生した問題について都度原因を分析し、再発防止策の検討と対策を実施しています。

対策の実施にあたっては、問題が発生した都度ならびに毎週1回の運用部門ミーティングにて議題が定義され、技術者によって対策が検討され、対応計画に基づき処置が行われます。

オペレーション管理

当社では、サービスによって、お客様とSLA(Service Level Agreement)を合意するか、もしくはOLA(Operation Level Agreement)と言われる当社組織内部で合意されたレベルをお客様に対してサービス提供目標として開示するかを分けて管理・レビューしています。

クラウド型監視サービスではサービス仕様書とSLAを、システム運用サービスの一部メニュー、システム監視・障害対応サービスでは、サービス仕様書とOLA をお客様にご提示し、管理・レビューしています。

社内リソースの管理

当社サービスを安定維持されるためには社内リソース(メンバー)の管理が重要となってきます。
サービスを提供するうえでは、適切なスキルセットを持つ人材を、負荷が集中しないよう配分し平準化させていくことが大切です。そのうえで必要となるのが、リアルタイムにメンバーの稼働状況を把握できるシステムです。
各メンバーは作業に掛かる予定工数、稼働工数をポータルサイトに投入するとともに、管理者は稼働工数の平準化を図るためにメンバーの入れ替えやシフトローテーションの組み換えなどを行い、月内の総稼働時間が一定時間以内に収まるよう努めています。

外部委託先の管理

当社サービスに関わる人的作業の一部を外部事業者に委託しています。委託に際しては、「委託先企業のセキュリティ対策と委託先企業に適用するセキュリティ対策基準が統一されていること」、「情報セキュリティに関する専門性や委託する業務を理解してもらうための取組みが行われていること(フォローアップ体制が取られていること)」が重要となります。

当社では以下の取組みを持って委託先企業の管理を行っています。

  • 情報セキュリティ対策の確認項目を取り纏めたチェックシートを用い、年1回委託業務先ごとに評価を実施
  • 委託業務遂行中に洗い出されたリスクを「すぐに実施すべき対策」「期限を設けて実施すべき対策」「将来的に実施すべき対策」にわけ、是正指示を委託先に提示するとともに、是正が適切に行われているかを確認ならびにフォローする

運用するなかで上がってきた課題や問題の分析

システム運用の中で収集された課題や問題に対して、「すぐに実施すべき対策」「期限を設けて実施すべき対策」「将来的に実施すべき対策」にわけ、是正策の実現性・消費する時間を含めたコストを分析し、スケジュールに基づいて遂行することが必要です。
当社では、この取り組みを週1回の技術部門ミーティングで議題として提示し、各対策に対する進捗状況を管理しています。

まとめ

今回は、運用体制構築するための前提である「何を、どう管理するのか」の1つ、「サービスレベル管理プロセス」について、取り組み事例(当社の場合)も交えてご紹介しました。
サービス提供者と利用者とで事前合意したサービスレベルを定常的に監視し、また、プロセスの中で上がってきた課題や問題点を継続的に改善することで、サービスの改善や顧客満足度の向上に繋げることができるでしょう。

次回は、「可用性管理」についてお話しします。

運用設計のポイントを手っ取り早く把握したい方へ

クラウド運用課題を解決する「運用設計の考え方」「運用設計のフレームワーク」のポイントを手っ取り早く把握したい!という方は、以下のホワイトペーパー「運用設計が丸わかり!クラウド運用課題解決への4ステップ(運用設計ガイド)」もあわせてご参照ください。

「クラウド運用の課題と対応策」や「自社で運用設計する際の課題」、「運用設計と継続的な運用改善を継続させるポイント」も記載していますので、参考になさってください。

Free

資料ダウンロード

課題解決に役立つ詳しいサービス資料はこちら

資料ダウンロード
  • 運用設計が丸わかり!クラウド運用課題解決への4ステップ(運用設計ガイド)

    クラウド運用課題を解決する「運用設計の考え方」「運用設計のフレームワーク」のポイントを解説します。

Tag: 運用設計

関連記事

Contactお問い合わせ

お見積もり・ご相談など、お気軽にお問い合わせください。

single.php