データガバナンスは必要?
Microsoftの実践フレームワークを解説
データ活用がビジネスのトレンドとなる中、「データが様々なシステム・データベースに分散しており利用しにくい」「データの品質に問題がある」「データ活用において機密データの流出リスクが心配」などといった課題を抱えている企業も多いのではないでしょうか。このような課題を解決し、データ資産の価値最大化や安全なデータ活用を進めていくためには、データガバナンスがポイントとなります。
この記事では、データガバナンスの概要や必要性に加え、Microsoft社のデータガバナンスフレームワークを参考に、データガバナンスの実践方法についても紹介します。
こんな方におススメ
- 自社ではデータを保有・活用している
- 昨今のセキュリティ関連のニュースなどによりデータガバナンスに取り組みたいと思っている
- データガバナンスにどのように取り組んでいけば良いのか知りたい
目次
1. データガバナンスとは?
データガバナンスとは、組織内のデータ資産を安全かつ効率的に利用するため、ポリシーやプロセスなどを定義して統制をかける活動を指す言葉です。
多くの企業では、データはデータセンターやクラウド、エッジなど様々な環境に分散しているという現状があります。このような状況では、必要なデータを探すのも大変です。また、セキュリティリスクも高まります。
これらの課題を解決するためには、全社で一元的にデータをマネジメントしていく、データガバナンスの取り組みが必要です。近年では「CDO(Chief Data Officer:最高データ責任者)」のポジションを設置して、データガバナンスに取り組む企業も増えています。
具体的には、データガバナンスの取り組みにより以下を実現できるように、自社のポリシーやルールの整備、ルールの順守状況の確認などを行っていきます。
<データガバナンスによる実現目標>
- データが検出可能であること
- データが正確であること
- データが信頼できること
- データが保護可能であること
- データセキュリティを確保すること
データガバナンスがないことによる様々な影響
組織にデータガバナンスが存在しない場合、どのような影響があるのでしょうか。
以下では、業務・経営・コンプライアンスの3つの観点で影響を解説します。
● 業務オペレーションにおける影響
データガバナンスが存在しなければ、分散したデータの中から必要な情報を見つけるのは困難です。また、データの信頼性が担保されていなければ、不完全で不正確なデータにより業務プロセスに影響が生じます。
結果として、データの提供に時間がかかる、もしくは業務の品質が低下するといった弊害が生じ、場合により顧客の不満の原因ともなるでしょう。
● 経営判断と企業業績管理における影響
経営判断においてデータの活用が重要視される中、データが不正確であると経営判断の質の低下につながります。また、必要なデータが収集できなければ、経営として決断が必要な場面に決断の根拠が得られないという問題も生じます。
また、企業の業績管理の観点では、不正確なデータはIRなど対外的な発信にも影響が生じるでしょう。
● コンプライアンスに対する影響
特に個人情報をはじめとした秘匿性の高いデータは、適切にデータセキュリティ対策がされていなければ情報漏洩のリスクが付きまといます。
加えて、業界によっては行政から様々な報告を求められることもありますが、不正確なデータに基づく行政への報告は場合により法令違反のリスクにもなります。
2. データガバナンスの必要性と効果
なぜ企業はデータガバナンスに取り組まなければならないのでしょうか。ポイントは以下の3点です。
● データ品質向上によりデータを信頼できるものとする
上述の通り、信頼できないデータは企業の運営に影響します。データの品質を向上させ、信頼性を高めることで業務プロセスのミスや遅延、不正確な意思決定を発生させないようにします。
データ品質として、データが完全・一意・有効・正確であり、かつタイムリーに利用できることが重要です。データガバナンスにより、これらの観点でデータの品質を強化します。
● 分散しているデータを一元的に把握できるようにする
オンプレミス環境、クラウド環境、IoTによるエッジ環境など、様々な環境に分散しているデータを一元的に集約することは簡単ではありません。
現実的には、データガバナンスにより、少なくともどこに何のデータがあるか誰でも把握できる状態を目指すのが最初の目標となります。
これにより、データ活用において効率的にデータを探すことができ、また利用できるデータの幅も広がるでしょう。
● 組織全体で取り組みを行えるようにする
データに関する活動は、組織全体で行うことが肝要です。組織全体にデータガバナンスによる統制を適用するために、データの最高責任者であるCDOやデータの維持管理を行うデータスチュワード組織、データに関するセキュリティチームを設置していく必要があります。
組織全体でデータガバナンスを行うことで、部署によりサイロ化されたデータを一元的に管理しつつ、セキュリティ対策に劣る部署からのデータ流出リスクを下げることなどにもつながります。
3. データガバナンスフレームワークで実践
データガバナンスフレームワークとは、データガバナンスを実践する上で必要となるプロセスやリソースなどを体系化したものです。ベストプラクティスであるデータガバナンスフレームワークに沿って取り組みを行うことで、漏れなく・効率的なデータガバナンスを実現できます。
データガバナンスフレームワークとして様々な類型が検討されていますが、ここではMicrosoft社のデータガバナンスフレームワークをご紹介します。
下図は、Microsoft社のデータガバナンスフレームワークを図示したものです。Microsoft社のデータガバナンスフレームワークは以下の要素から構成されています。
● データガバナンスのビジョンと戦略
データガバナンスの起点は、ビジョンと戦略の策定です。
ここでは、自社にどのようなデータがあるのか。データの発生元はどこか、リスクはどこにあるのかなどを整理し、データガバナンスの方向性を検討します。また、上述の通り、領域横断的な動きが必要となるため、CDOやデータスチュワード組織などを設置して組織全体でデータガバナンスを実現できるようにします。
● ヒト・プロセス・ポリシー・テクノロジー
続いて、データガバナンスの実行に必要となる人的リソース、業務プロセス、データの取り扱いルールなどを定めたポリシー、ツールなどのテクノロジーを検討します。
● データライフサイクル
データガバナンスにおいては、データのライフサイクル全般にわたって統制をかけていく必要があります。
よって、データの生成から蓄積、利用、破棄に至るまでのデータライフサイクルを意識し、それぞれのフェーズにおいてどのような対応が必要であるのか検討します。
● データの保管先環境
データを実際に保持するエッジやデータセンター、クラウドなどがフレームワークの最下層に位置します。
どのような環境にデータが存在するのかを整理し、一元的な管理につなげます。
4. データガバナンスに必要なソリューション
それでは、データガバナンスを実行していくためにはどのようなソリューションが必要なのでしょうか?
具体的には、以下の要素が必要です。
- データの検出・可視化:組織内のデータを自動で検出し、どこに何のデータがあるか把握できるようにする。その際、テーブル名や形式などのメタデータも管理する
- データの品質管理:データの品質を担保し、信頼性の高いデータを利用できるようにする
- データの保護:特に機密データに対して、利用状況や保管状況を可視化する
統合的にカバーできるサービスはMicrosoft Purview
これらの機能を統合的にカバーできるのが、Microsoft Purviewです。
Microsoft Purviewは、Microsoft社が提供するデータガバナンスソリューションであり、大きく以下の3つの機能から構成されます。
- Data Map:クラウド・オンプレミス環境のデータを自動で検出。メタデータも含めて常に最新の状態でデータを可視化する
- Data Catalog:分類、秘密度など様々な観点でデータ検索を可能とする。用語集の設定によりデータに対する理解を深められるほか、自動タグ付け機能やデータ資産の利用状況可視化も
- Data Insights:主にデータ責任者やセキュリティ管理者向けに、データのアクセス頻度や機密データの取り扱い状況、データの移動状況などを一目で把握できるようにする
Microsoft Purview(旧:Azure Purview)の詳細については、こちらの記事もご覧ください。
関連記事:Purviewとは?活用メリットと機能を解説 >
Microsoft社の製品であるMicrosoft Purviewは、多くの企業で利用されているAzure ADやMicrosoft 365などのMicrosoft製品との親和性も高く、データガバナンスをこれから実践してこうとしている企業にはおすすめの選択肢といえるでしょう。
なお、Microsoft社では、データセキュリティに対して「いかなる国や行政機関であっても、保管されているデータは一切渡さないことを宣言する」というコミットメントを出しています。機密データの流出は企業にとって大きなリスクとなるため、信頼性のある企業の製品を選択することは重要です。
5. データガバナンスを取り込んだデータ基盤モデル
最後に、データガバナンスを考慮したデータ基盤モデルを紹介します。
ビッグデータ分析基盤の一般的な構成
ビッグデータ分析基盤の一般的な構成は下図の通りです。
この構成例では、データ発生元からバッチ処理でデータを取り込み、データレイクに格納の上、データカタログ機能により必要なデータを検索して確認。データレイクから分析用のデータストアや分散処理可能なデータ基盤などに取り込んだうえで、分析レポートの作成や機械学習などによる解析を行います。
また、リアルタイムデータについては、ストリーム処理を行ったうえでダッシュボードなどにて可視化してくといったフローとなります。
Microsoftソリューションを活用した構成例①
この構成をMicrosoftソリューションにて実現する場合、どのような構成となるのでしょうか。
データの連携処理にはETLツールである Azure Data Factory を利用し、データレイクであるAzure Data Lake Storage に格納します。ここから有用なデータを探すために、上述した Microsoft Purview が有効です。データガバナンスを適切に実行できていれば、ここでデータ活用の効率や効果が上がります。
その他、データストアとして利用できる Azure Synapse Analytics や分散データ処理を実現するAzure Databricksなどを活用し、 Power BI よる可視化や Azure Machine Learning による分析につなげていきます。
Microsoftソリューションを活用した構成例②
上述した構成は、統合分析基盤である Azure Synapse Analytics で置き換えることもできます。Azure Synapse Analyticsはデータウェアハウスの機能に加え、分散データ処理やETLツールとしての機能も備えます。Azure Synapse Analyticsを利用することで、シンプルな構成でビックデータ解析基盤を構築できます。
加えて、Azure Synapse AnalyticsはAzure ADをはじめとしたセキュリティ機能やPower Apps、Dynamics 365など様々な機能と連携することもできます。
6. まとめ
この記事では、データガバナンスの概要や必要性、データガバナンスフレームワークの活用、実際の構成例を通したデータ活用イメージを紹介しました。
Microsoft Purviewをはじめとした各機能を最大限に利用してくことで、効果的なデータガバナンスの取り組みが実現できるでしょう。
当社では、データガバナンスやAzureを活用したデータ分析基盤の構築について解説したセミナー動画を配信しております。
データガバナンスを念頭に置いたデータ基盤の構築について、より詳細に知りたい方は、ぜひ以下のリンクから動画をご覧ください。
/ データ基盤の切り替えプロジェクトの進め方を解説! \
ぜひ、お役立ていただけましたら幸いです。
この記事を書いた人
- Azure導入支援デスク 編集部
-
こんにちは!双日テックイノベーション(旧:日商エレクトロニクス)では、Microsoft Azure活用に関する有益な情報を皆様にお届けしていきます。Azure移行、データ活用、セキュリティなどに関するお困りごとや、Microsoft Azureに関する疑問点などお気軽にご相談ください。
ブログにしてほしいネタなどのリクエストもお待ちしております。
この投稿者の最新の記事
- 2024年9月12日ブログ2024年版 最新のデータ活用基盤とは?グローバル企業の事例も紹介!
- 2024年7月16日事例Azureデータ活用基盤導入事例:第一フロンティア生命保険株式会社
- 2024年3月27日ブログデータレイクとは? ~DWHとの違い、メリット、活用例などをわかりやすく解説~
- 2024年3月6日ブログデータカタログとは?~機能、導入のメリット、導入方法まで解説~