Azure Managed Service Column <Azure運用コラム>

データウェアハウス(DWH)とは?データベースとの違いとAzureでのデータウェアハウスの実現方法を解説

Category: 実践編

2021.09.10

ビッグデータ時代のデータ活用方法とは?

昨今、企業の成長のためにデータの活用を積極的に進める企業が増えています。企業がビジネスの創出や改善を行うために、システムが扱う膨大なデータを一箇所に集約し、様々な視点から分析できるようにする必要があります。そのための役割を担うのが、「データの格納庫」という意味を持つデータウェアハウスです。最近では、データの蓄積・分析だけでなくAIやIoTの基盤としても活用されています。

本記事では、データウェアハウスの概要と、マイクロソフトのクラウド「Microsoft Azure」においてデータウェアハウスを実現する方法について解説します。

1. データウェアハウスとは

システム開発に携わっていると、データウェアハウスという言葉をよく耳にするかもしれません。データウェアハウスとはどのようなものでしょうか。ここでは、データウェアハウスの概要について解説します。

1.1 データウェアハウスとは

データウェアハウス(DWH)は企業の意思決定を支援するための大規模なビジネスデータを保管した「データの保管庫」です。企業のシステムが扱うさまざまな種類の大量のデータ(ビッグデータ)を一箇所に集約し、意思決定に必要なデータを様々な視点・角度から分析して抽出するための仕組みです。

データウェアハウスはデータの蓄積と分析に最適化された構成となっていることが大きな特徴で、目まぐるしく移り変わるビジネス環境に対応して迅速に意思決定を行うために、多くの企業においてデータウェアハウスの重要性が高まってきています。

1.2 一般的なデータベースとの違い

データウェアハウスと、一般的なリレーショナルデータベース(RDBMS)との違いどのようなものでしょうか。

一般的に、データウェアハウスは大容量のデータを蓄積・分析することを目的としており、データの入出力と分析業務に最適化された構成を取ります。

一方、リレーショナルデータベースは業務処理を実行することを目的としており、分析以外にもデータの更新や削除、複雑な検索を行うために最適化された構成を取ります。このように、データを扱う目的に応じて使い分けることが一般的です。

1.3 データウェアハウスとBIの関係

データウェアハウスとBI(ビジネス・インテリジェンス)は密接な関係を持ちます。BIはデータウェアハウスに蓄積されたビジネスデータを分析し視覚的にわかりやすく表示するためのツールです。効果的なデータ分析を行うために、データウェアハウスとBIを組み合わせて利用することが一般的です。

1.4 AIやIoT分野におけるデータウェアハウスの活用

データウェアハウスは、AIやIoTの分野でも活用されています。企業が扱うデータは増加の一途を辿っているため、人間による分析が限界に近付いています。そのため、最近ではAI(人工知能)を活用したデータ分析を行う手法が増えています。ビッグデータを読み込ませ、特定のアルゴリズムでパターン分析を行う機械学習が現在のAIで多く使われています。

また、IoTの分野では、大量のデバイスからデータを受信する必要があるため、デバイスデータの受け皿としてデータウェアハウスが活用されています。このようにビッグデータを活用するための基盤としてのデータウェアハウスは重要な位置付けとなっています。

2. Azure Synapse Analyticsとは

マイクロソフトのクラウド、Microsoft Azureでは、データウェアハウス実現のために、データ蓄積と分析を一体化したサービスとしてAzure Synapse Analyticsを提供しています。ここでは、Azure Synapse Analyticsの概要と料金体系について解説します。

2.1 Azure Synapse Analyticsとは

Azure Synapse Analyticsは、Azureのサービスのひとつで、ETLエンジン、データウェアハウス、ビッグデータ分析が一つになった統合的な分析プラットフォームで、「Azure SQL Data Warehouse」の後継サービスです。AzureのETLサービスであるAzure Data Factoryと同じデータ統合(ETL)エンジンとBIツールと機械学習エンジンを持つ統合的なサービスです。主に下記の機能を持っています。

  • データの収集・変換・格納
  • データの蓄積・管理
  • データのセキュリティ保護
  • 分析ツール・機械学習エンジン

これらの機能を組み合わせて利用することで、Azureクラウド上で、スムーズにデータウェアハウスとデータ分析を行う基盤を構築できます。

2.2 Azure Synapse Analyticsの料金体系

Azure Synapse Analyticsは利用する機能によって下記のように料金体系が分かれています。なお、1年分または3年分の「事前予約」を行うことで最大65%のコスト削減も可能です。

  • データの探索とデータウェアハウス
  • Apache Sparkを使用したビッグデータ分析
  • データ統合(ETL)

データの探索とデータウェアハウス

格納されているデータ量(TB)、処理されたデータ量(TB)、SQLを処理するためマシンリソースを表すData Warehouse ユニット(DWU)数ごとの使用時間に応じて課金されます。

Apache Sparkを使用したビッグデータ分析

データ分析や機械学習のインスタンスの数と実行時間に対して課金されます。

データ統合(ETL)

データパイプライン(データの移動)の実行数と移動時間、データフロー(データ変換)実行時の仮想コア数あたりの実行時間、作成、読み取り、更新、削除、監視などの操作回数に対して課金されます。

3. Azure Synapse Analyticsのメリット

Azure Synapse Analyticsを利用するメリットはどのようなものでしょうか。Azure Synapse Analyticsを利用するメリットは下記の通りです。

  • 無限のスケール
  • ETLと分析基盤との統合による開発時間の短縮
  • リアルタイムでの分析情報取得
  • 比類のないセキュリティ

3.1 無限のスケール

Azure Synapse Analyticsが扱うデータはひとつではなく、複数のデータウェアハウスやデータベース、ビッグデータをシームレスに統合して扱うことが可能です。このため、企業が持つ全てのデータを制限なく統合的に分析することが可能となります。

3.2 ETLと分析基盤との統合による開発時間の短縮

Azure Synapse Analyticsは、データウェアハウスに必要なETL(データの収集・変換・取り込み)や、BI・機械学習による分析を含めた統合的なプラットフォームとなっているため、プロジェクトの開発にかかる時間を大幅に短縮可能です。

3.3 リアルタイムでの分析情報取得

Azure Synapse Analyticsは、NoSQLデータベースであるAzure Cosmos DBが持つAzure Synapse Linkというリアルタイム分析機能を利用することで、稼働中のデータウェアハウスからリアルタイムに近い分析を行うことができます。また、この機能により、複雑なETLパイプラインなどを追加で準備することなく、他のAzure上のデータベースと統合して分析を行うことが可能です。

3.4 比類のないセキュリティ

脅威の自動検出や暗号化の常時有効化などの高度なセキュリティ機能により、データの安全性を確保ことができます。列レベルと行レベルのセキュリティ、列レベルの暗号化、動的データマスキング等の機能により、データレベルで細かな制御が可能になり、リアルタイムで機密データが自動的に保護されます。

まとめ

企業の成長のために、データ活用が欠かせない時代になっています。データウェアハウスは、企業が持つ膨大なデータを集約する基盤で、多角的に分析を行うことで新しい価値を見出し、新しいサービス・ビジネスへとつなげていくことができます。Azure Synapse Analyticsは、そうした企業のためにデータウェアハウスと分析基盤を統合したサービスです。自社のDXを見据えたデータ活用を検討してみてはいかがでしょうか。

Azure設計・構築を任せたい

Azure構築サービス

Azure構築サービス

Microsoft Azureを利用したシステムの設計・構築を代行します。お客様のご要件を実現する構成をご提案・実装いたします。

Tag: Azure Synapse Analytics データウェアハウス

Contactお問い合わせ

お見積もり・ご相談など、お気軽にお問い合わせください。

single.php