Case Study
Pandora FMS Enterprise

楽天株式会社
楽天グループ株式会社

楽天グループ株式会社(旧:楽天株式会社)は、インターネット(市場事業、トラベル事業、その他、国内インターネットサービス、海外事業等)、金融サービス(クレジットカード事業、銀行事業、証券事業、電子マネー事業等)その他(通信事業、プロスポーツ事業等)と幅広いサービスを提供する、グローバル・インターネット・サービス企業です。

楽天グループ株式会社は、インターネット・サービスの共有監視基盤に Pandora FMS Enterprise を導入。運用業務に最適な監視基盤を低コストで実現。

概要

楽天グループ株式会社のインターネット・サービスは、だれでも、いつでも、どこからでも、利用できるサービスである。会員数が 1 億人以上(2021 年時点)を超える巨大なインターネット・サービスを低コストで最適に運用するため、Pandora FMS Enterprise を採用。今後のサービス拡張に柔軟に対応する統合監視フレームワークを構築した。

導入サービス

選定理由

システムの刷新にあたり、

  • 導入および運用コスト
  • データ移行の容易性
  • 冗長構成の可否
  • 設定済みの監視項目を含めた既存環境の運用プロセスの継続
  • 今後追加する監視項目の適用

の 5 点で評価が行われ、Pandora FMS Enterprise の導入が決定。

楽天グループ株式会社様 導入事例の詳細

楽天株式会社

【取材対応】
楽天グループ株式会社
グループシェアードサービス開発・運用部 グループインフラ構築・運用課
共有インフラ構築・運用グループ
マネージャ 根本 良雅 氏(写真中央)

楽天グループ株式会社
グループシェアードサービス開発・運用部 グループインフラ構築・運用課
共有インフラ構築・運用グループ
竹田 茂馬 氏(写真右)

楽天グループ株式会社
コアテクノロジー開発課 日本システム構築運用グループ
グループマネージャ 藤巻 和人 氏(写真左)

1. 背景

ニーズにあったサービスの提供と日々成長する事業

「世界一のインターネット・サービス企業」を目指し、国内最大のインターネットショピングモール「楽天市場」に代表される EC 事業や、「楽天トラベル」のトラベル事業、「Infoseek」等のポータル・メディア事業、「楽天証券」、「楽天カード」等の金融事業、さらにはプロ野球球団「東北楽天ゴールデンイーグルス」の運営及び関連商品の企画・販売を手掛けるプロスポーツ事業に至るまで幅広い事業を展開する楽天グループ株式会社(以下、楽天)。
1 億人以上(2021 年時点)を超える楽天会員に様々なインターネット・サービスを提供することで、あらゆるサービスをインターネット上にてワンストップで利用できる“楽天経済圏” を確立している。

楽天に高いサービスレベルが求められることはいうまでもない。
たとえば、楽天市場だけでも、約 56,000 の店舗、3.6 億点を越す商品登録数(2022 年 5 月時点)の大規模サービスだ。

これらのサービスの稼働環境について、共有インフラ構築・運用グループ マネージャの根本 良雅氏は次のように語る。

「お客様に常に最適なサービスレベルで提供できるよう、楽天の提供するサービスは数千台のサーバからなる強力な共有システム基盤の上で稼働しています。共有システム基盤は柔軟性と堅牢性、そして最適なパフォーマンスが確立されていますので、サービスがダウンするようなことはありません。これによって、お客様が安心してサービスを利用することができるのです」

2. 課題

サービスの拡張に伴う運用コストの増加

安定したサービスの提供には、強力なシステム基盤だけではなく、障害の発生にも迅速に対応できるシステムの運用体制が不可欠だ。

楽天では強力な統合監視フレームワークを 2001 年 5 月に構築。以降、最適な運用を行っている。統合監視フレームワークは楽天が提供する数多くのサービスを網羅しており、それぞれの職責に応じたサービスおよび項目の監視をオペレータに提供し、不測の事態におけるワークフローを備えている。万が一サーバがダウンしたとしても、すぐに適切な対応を取ることができる。

既存の監視システムで行っているのは主に死活監視であるが、監視対象や監視項目の数は新しいサービスが加わるたびに増加する。これまでの運用においては毎年 20 ~ 30 %程度増加し、現状で 1 万を超える

しかし、サービスの追加はとどまることはなく、さらに現在進められている共通システム基盤の仮想化やクラウド化に伴って、その数がこれまで以上に増加することも見込まれていた。もはやコストの増大は大きな経営課題へと発展しており、事業規模の拡大にも低コストで対応するための新しい仕組みが求められたのである。
このような経緯により、10 年以上使い続けた監視システムの刷新が検討された。

システムの刷新にあたり、注力された評価ポイントは、「導入および運用コスト」、「データ移行の容易性」、「冗長構成の可否」、「設定済みの監視項目を含めた既存環境の運用プロセスの継続」、「今後追加する監視項目の適用」の5 点である。コスト削減はもちろんのこと、監視基盤の必須条件としての冗長構成、既存環境の監視内容を容易に引き継げることでのオペレータの負荷軽減が必要だった

3 カ月間にわたる製品検証の結果、Pandora FMS Enterprise(以下、Pandora )の採用が決定したのである。

3. 導入の効果

大幅なコスト削減とスムーズな移行、コスト効率の良い冗長構成

Pandora 採用の決め手は、すべての要件で他社製品より優れていたことだという。根本氏はコスト削減効果を高く評価する。

「オープンソースの製品や他の商用製品とあわせて検討しましたが、ライセンスも含めた TCO(総保有コスト)は Pandora がもっともよいと判断しました。実際、監視項目の増加に伴うシステムの増強を抑制でき、コストが既存のシステムに対し 40 %程度削減されました。さらにコストが 2 倍になる見込みだった次年度を考えると大幅なコスト削減効果があったと考えています」

その他の技術的な評価ポイントについて、新システム検討を担当する共有インフラ構築・運用グループの竹田 茂馬氏は次のように語る。

「既存システムと同等の監視ができないとサービスレベルの低下につながるため、監視項目の対応を重視しました。他社製品ではデータ移行プログラムをフルスクラッチで作成するか、データを再入力する必要がありました。1 万を超える監視項目を手入力することは現実的ではありません。
Pandora の場合、豊富な API や Plug-In の提供によって監視項目の移行や追加が容易でした。監視システム自身の冗長性については、検証の結果、オープンソース製品では冗長構成を実現できず、商用製品では高額なクラスターシステムが別途必要となり、既存システムよりも高額になるため採用に至りませんでした。Pandora の場合、商用製品と比べても優れた冗長構成を容易に構築できました

Pandora が採用された新しい統合監視フレームワークは、データセンター内に、監視サーバ 1 台に加え、HA 構成の Syslog/SNMP 監視、5+1 構成の IPv4 サービス監視、1+1 構成の IPv6 サービス監視の 3 つのグループで構成されている。
この構成は別のデータセンターにも構築されており、データセンターをまたいだ冗長構成となっている。また、将来サーバを追加して、更に増強することも簡単な構成になっている。

楽天市場の運用も担当し、今回のプロジェクトにも参画する日本システム構築運用グループグループマネージャの藤巻 和人氏は実際に運用する側の意見として、Pandora の導入効果を次のように語る。

「現場で監視サービスを利用する立場としては、これまでの監視システムとほぼ同じ構成で導入でき、運用プロセスに変更なかったことが大きなメリットです。運用プロセスがいろいろある中でスムーズに移行でき、様々なことができる点を高く評価しています」

現場でも高い評価を得た Pandora。その理由はデータ移行の成功と高い柔軟性に他ならない。その点について竹田氏は次のように語る。

「Pandora の API を利用したデータ変換プログラムを自作し、データ移行を行いましたが、既存データを Export し、必要な設定値を入力することで数万単位の監視項目を 1 日で移行できました。Pandora の高い柔軟性のおかげで移行は極めてスムーズでした。
Pandora はオープンソースベースの商用ソフトウェアですが、他のオープンソースと比較してもサービスレベルが高く、監視システムの冗長性が確保できている斬新的な製品です。楽天規模となると冗長性と柔軟性が極めて重要なため、非常にマッチしていると思います」

4. 今後の展開

ユーザレベルの監視へ対象を広げる

楽天株式会社

楽天の取り組みは単なる移行では終わらない。運用効率を高めるため、Pandora の API を活用し、監視の追加が容易にできるようカスタマイズする予定だという。また、さらなる高いサービスレベルの実現のため、より高度な監視機能を追加する考えだ。

藤巻氏は今後の展望を次のように語る。

「Pandora の導入により、今まで導入しなかったり、他で独自で作りこんでいたものも統合監視システムに取り込むことができました。次のステップとしては、現状の死活監視に加え、Web が表示されるまでの時間やアプリケーションのコンテンツ監視など、よりユーザレベルの監視ができるようになればと考えています」

楽天のアールワークスへの信頼は高い。竹田氏によると製品対応のスピードが速く、不具合修正なら早ければ中 1 日、機能追加要求についても 1 週間ほどでフィードバックがあるなど、迅速な対応に満足しているという。

また、アールワークスが手順書のベースを作成したことにより、楽天側での工数を省くことにも貢献できたということだ。こうしたアールワークスの支援を踏まえ、今後の期待を根本氏は次のように語る。

「アールワークスに対しては、これまでの対応が速かったことを高く評価しています。これから本格的な導入がはじまりますが、今後のサポートにも大きな期待を寄せています。とくに自分たちの力だけで対応できないところを二人三脚でやってほしいと思っています」

楽天が掲げる「世界一のインターネット・サービス企業」という目標。その実現に不可欠な柔軟な監視フレームワークの構築。その重要な役割をアールワークスの「PandoraFMS Enterprise」が担っている。

お問い合わせ・ダウンロード

Pandora FMS Enterprise の詳しい内容については、お気軽にお問合せください。

お問い合わせ
03-5946-840503-5946-8405平日 10:00~18:00

Pandora FMS Enterprise

  • 大規模システム向け統合システム監視ツールPandora FMS Enterprise

    大規模システム向け統合システム監視ツール Pandora FMS Enterprise

    世界194か国から120万ダウンロード以上の支持を得るオープンソースの監視ツール Pandora FMSに、大規模システム向け機能を追加した Pandora FMS Enterprise。オープンソースベースの商用製品だから実現できる「運用コストの削減」と「使い勝手の良さ」が特徴です。

Contactお問い合わせ

お見積もり・ご相談など、お気軽にお問い合わせください。