Microsoft Fabricとは?
メリットやコストなど全貌を一挙解説
こんにちは、双日テックイノベーションの鈴木です。
データは今日のビジネスにとって不可欠となってきましたが、その真の価値を引き出すためには、先進のツールとテクノロジーが必要ですね。
ここで登場した新たなデータ活用ソリューションが、「Microsoft Fabric」です。
本日は、そのMicrosoft Fabricについて、
今までのデータ分析ツールと何が違うのか、その構成要素、特徴、コストなど、基本を解説したいと思います。
こんな方におススメ
- データ活用ツールを比較検討している
- Microsoft Fabricについて調べている
- Microsoft Fabricが他のデータ分析ツールと比べて何が違うかイメージを付けたい
目次
1. Microsoft Fabricとは
では、まずは製品の基本から解説します。
Microsoft Fabric(以下、Fabric )は、2023年11月一般提供が開始した、次世代の「SaaS型データ分析ツール」です。
データの重要性が認識され活用が進められる中で発生した、データの増大、サイロ化、分析ツールの混在による複雑化…などの問題解決や、データアクセスと共有やデータガバナンスとコンプライアンス強化のニーズを実現するために誕生しました。
そのため、Fabricを利用すると、データ レイク、データエンジニアリング、データ統合、ビジネスインテリジェンス(BI)など、幅広い機能を、統合された環境で活用できるようになります。
Microsoft Fabricの全貌を解説したダウンロード資料もございます。
気になる方はぜひチェックしてみてください。
Microsoft Fabricの概要資料
ダウンロードする
2. Microsoft Fabricの特徴
Fabricの特徴は、下記の4点です。
①統合されたSaaS基盤
前述の通り、Microsoft Fabricはデータ活用に必要な要素を包含した「オールインワンデータプラットフォーム」です。
様々なデータ分析ツールをツギハギすることで生じる複雑な運用管理の解消、全社横断のデータ共有の簡易化が実現します。
さらに、SaaSですので、複雑なプロビジョニング作業やメンテナンスも不要になり、よりデータの管理と利用に集中できるようになります。
②既存のデータ資産を活用できる
Microsoft Fabricは、「データの仮想化」により、既存のデータ資産を活用できます。
既存データの仮想化とは、データのコピーを作らずに、複数のデータソースを仮想的な単一のデータソースとして扱うことを可能にする技術のことです。(ショートカットを作るイメージです。)
基本はすべてのデータをデータレイクに集めるのが良い、とはいっても完璧に1か所に集めるのはかなり骨が折れますよね。
そこでこの技術を用いることで、データの場所を意識せずに必要な情報にアクセスできるようになるのです。
Azureの他のデータ関連サービス(Azure Synapse Analyticsなど)には、これは実現できません。
さらに、Azureサービスだけでなく、AWS S3にも対応しているなど、マルチクラウド環境でも活用できます。(Google Storageは近日公開予定とのことです。)
③データセキュリティとコンプライアンスを強化
Fabricには、データのセキュリティとコンプライアンスを確保し、組織のガバナンス基準に合わせて管理する機能が構成されています。
情報保護:
Microsoft Purview Information Protectionの秘密度ラベルを使用してFabricデータを検出、分類、保護します。
データ損失防止 (DLP) ポリシー:
Power BI セマンティックモデルに対してDLPがサポートされており、機密データの検出と保護を可能にします。
推奨:
保証によって、ユーザーが信頼できる高品質のアイテムを特定しやすくなります。
メタデータのスキャン:
カタログ化ツールがテナント内すべてのFabricアイテムのメタデータをカタログ化し、レポート化します。
系列:
ワークスペース内のアイテム間の関係を視覚化し、データフローをわかりやすくします。
これらを、Microsoft Purview ハブ(*現状プレビュー)というレポートページで確認できます。
④Copilotとの統合
Fabricでは、すべてのワークロードにAI Copilotが標準搭載される予定です(*現状プレビュー)。
ChatGPTの様な対話型AIにより、自然言語を用いたデータのクエリやモデルの構築が可能になります。
これにより、コード補完によるデータパイプライン構築や複雑な分析モデルの作成の簡易化、日常タスクの自動化による運用負荷軽減が期待できます。
⑤コストを抑えて使える
Fabricは、コンピューティングリソースを複数のワークロードで共有することができます。これにより、未使用のリソースの無駄遣いを減らし、コストを最適化することができます。
3. Microsoft Fabricで実現できること
① データ統合
組織内のさまざまなデータソースからデータを統合し、一元化されたデータレイクで管理できます。異なるデータエンジンからのデータを統合するためのデータ統合機能が提供されています。
② データエンジニアリング
データの整形や加工などのデータエンジニアリング作業を行えます。データのクレンジング、変換、統合などを行うための機能が提供されています。
③ データウェアハウス
データの保存、管理、クエリの実行など、データウェアハウスに関連する作業を行うことができます。
④ データサイエンスモデリング
データサイエンスモデルの構築や実行をサポートしていますので、データを活用して予測モデルや機械学習モデルを作成を行えます。
⑤ リアルタイム分析
リアルタイムでのデータ分析とビジュアライゼーションが可能です。データのストリーミング処理やリアルタイムのダッシュボード作成を行えます。
⑥ ビジネスインテリジェンス(BI)
データの可視化、レポート作成、ダッシュボードの作成などを行うことができます。
4. Microsoft Fabricの構成要素
以上の様なことは、下記のコンポーネントにより実現されています。
① OneLake
Fabricの中核をなすコンポーネントで、組織内のすべてのデータを一元的に管理するデータレイクの役割を持っています。(Azure Data Lake Storage Gen2が基盤)
Fabric内のすべてのコンピューティングエンジンが、このOneLakeにデータを保存します。
大きな特徴は、「One Copy」のコンセプトで設計開発されている点です。
Fabric内の異なるコンピューティングエンジンがOneLake上にある同じデータにアクセスすることができ、データのコピーが発生しない仕組みになっているのです。
例:Sparkのエンジンを使ってOneLakeにデータ出力した際、そのデータにT-SQLやKQLクエリを使ってアクセスできる。
これまでは、異なるコンピューティングエンジン間でデータをやり取りする際にはデータをエクスポートしてインポートする必要がありましたが、その手間が省けるということです。
これは、データの移動にかかる時間とリソースを節約するだけでなく、データの一貫性と整合性を維持する上でも重要ですね。
また、「データのためのOneDrive」というキャッチコピーがついており、OneDriveのように細かい設定なしですぐに使い始めることができる点も特徴の1つです。
参考:https://learn.microsoft.com/ja-jp/fabric/onelake/onelake-overview
② DataFactory
オンプレ、クラウドを問わず、様々なデータソースからデータを取り込み、準備し、変換する役割を持っています。(ネイティブコネクタは200 種類超)Power Query のセルフ サービス性とAzure Data Factory のエンタープライズ性のイイとこ取りをしたようなものです。
データフローとデータパイプラインの2つの機能が実装されています。
データフロー:
数百のデータソースからデータを収集し、300以上の変換オプションを用いてローコードで簡単にデータを変換できる
データパイプライン:
クラウド環境で高度なワークフロー機能を実現できる。
大規模で複雑なETLワークフローやデータファクトリーワークフローを構築できる。
参考:https://learn.microsoft.com/ja-jp/fabric/data-factory/data-factory-overview
③ Synapse Data Engineering
データの収集、保存、加工、および分析を効果的に行うためのプロセスとツールを提供する機能です。
下記のことが実現できます。
- レイクハウスを使用して、データを作成および管理する
- レイクハウスにデータをコピーするためのパイプラインを設計する
- Spark ジョブ定義を使って、バッチまたはストリーミング ジョブを Spark クラスターに送信する
- ノートブックを使用して、データ インジェスト、準備、変換のコードを記述する
参考:https://learn.microsoft.com/ja-jp/fabric/data-engineering/data-engineering-overview
④ Synapse Data Science
機械学習モデルの構築、展開、運用をシームレスに行うためのデータサイエンスコンポーネントです。これにより、データモデリング、分析、機械学習プロジェクトを効率的に実施できるようになります。
具体的には、ノートブックとVisual Studio Codeなどの使いやすいツール、豊富なMLツールセット、Azure ML、MLFlowの統合、SynapseML Sparkライブラリ、PBI Direct Lake機能により実現されます。
参考:https://learn.microsoft.com/ja-jp/fabric/data-science/data-science-overview
⑤ Synapse Data Warehouse
大規模なデータ処理と分析のための高度なデータウェアハウスコンポーネントです。
膨大なデータセットを効率的に管理し、複雑なデータ分析とレポート作成を実現します。
強力なクエリ性能と柔軟なスケーリングオプションが特徴で、データの洞察を迅速に得られるようになります。
データは Delta-Parquet 形式で保存されるため、ベンダーロックインも起こりません。
参考:https://learn.microsoft.com/ja-jp/fabric/data-warehouse/data-warehousing
⑥ Synapse Real Time Analytics
Synapse Real Time Analyticsは、IoTデバイスやログなどのリアルタイムデータを分析するためのツールを提供します。ストリーミングデータやライブデータを迅速に分析し、即時の洞察を得ることができます。
ビジネス上の迅速な意思決定やリアルタイムのデータ駆動型アクションが行えるようになります。
参考:https://learn.microsoft.com/ja-jp/fabric/real-time-analytics/overview
⑦ Power BI
Power BIは、データをグラフィカルに可視化するBIツールで、データの収集、整理、分析、共有、視覚化を可能にします。Fabric上でも利用することができます。
Power BIを活用することで、ユーザーは、さまざまなデータソースからデータを取り込み、インタラクティブなダッシュボードやレポートを作成できます。これにより、データドリブンな意思決定を支援し、ビジネスの洞察を得ることができます。
参考:https://learn.microsoft.com/ja-jp/power-bi/fundamentals/power-bi-overview
⑧ Data Activator(プレビュー)
データの変更において、パターンまたは条件が検出されたときに自動的にアクションを実行できるようにするコンポーネントです。データが特定のしきい値に達したときや他のパターンと一致した場合に、Power BI レポートおよび Eventstreams 項目のデータを監視、その後、ユーザーへの警告や Power Automate ワークフローの開始などの適切なアクションが自動的に実行されます。
ノーコードで実装できます。
参考:https://learn.microsoft.com/ja-jp/fabric/data-activator/data-activator-introduction
5. Microsoft Fabricのコストについて
それでは、いよいよ、気になるコストについて解説していきます!
① Fabricの価格の構成要素
Fabricは、コンピューティングであるFabric容量とストレージであるOneLakeの2種類で構成されます。
② 購入方法は2種類
そして、2種類の購入方法があり、それぞれに特徴があります。
基本的には、コミットメントが無く従量課金制であるAzureからの購入が推奨されているようです。
Azure Poratal から購入(F SKU) | Power BI Premium 容量 を購入 | |
---|---|---|
課金制度 | 従量課金 | 月/年単位で課金 |
コミットメント | なし | 月単位のコミットメントあり |
ストレージ | 別 | 含む |
特徴 | 予約容量あり、容量の一時停止や再開が可能 | – |
<Azureから購入した際の料金>
参考:https://azure.microsoft.com/ja-jp/pricing/details/microsoft-fabric/#purchase-options
SKU | 容量ユニット (CU) | 従量課金制 | 予約 |
---|---|---|---|
F 2 | 2 | ¥56.895/時間 | ¥33.838/時間 ~41% の節約 |
F 4 | 4 | ¥113.789/時間 | ¥67.676/時間 ~41% の節約 |
F 8 | 8 | ¥227.577/時間 | ¥135.351/時間 ~41% の節約 |
F 16 | 16 | ¥455.153/時間 | ¥270.702/時間 ~41% の節約 |
F 32 | 32 | ¥910.305/時間 | ¥541.403/時間 ~41% の節約 |
F 64 | 64 | ¥1,820.609/時間 | ¥1,082.805/時間 ~41% の節約 |
F 128 | 128 | ¥3,641.217/時間 | ¥2,165.610/時間 ~41% の節約 |
F 256 | 256 | ¥7,282.433/時間 | ¥4,331.219/時間 ~41% の節約 |
F 512 | 512 | ¥14,564.865/時間 | ¥8,662.437/時間 ~41% の節約 |
F 1024 | 1024 | ¥29,129.729/時間 | ¥17,324.873/時間 ~41% の節約 |
F 2048 | 2048 | ¥58,259.457/時間 | ¥34,649.746/時間 ~41% の節約 |
これに加えてOneLakeの費用が従量課金制でかかります。
ストレージ | 価格 |
---|---|
OneLake ストレージ / 月単位** GB あたり | ¥3.6982 |
OneLake BCDR ストレージ/月 GB あたり | ¥5.9170 |
1 か月あたりの OneLake キャッシュ* GB あたり | ¥36.9812 |
③ 利用時にかかる費用
実際にFabricを利用するためには、Fabricそのものの費用に加え、ネットワーク利用料と、とユーザライセンスが必要になります。
Fabric ワークスペースへのPower BI 以外のアイテムの利用作成でしたらPower BI Freeで十分ですが、Power BIも含んだすべてのアイテムを触らせたい際には、ユーザーにPro以上のライセンスを付与する必要があります。(*ただし、CUが64以上の容量を購入することでPower BIのユーザライセンスを問わずデータを見ることができるようになります)
Power BIの価格については下記をご参考ください。
参考:Power BIの価格と製品の比較
Microsoft Fabricの概要資料
ダウンロードする
各機能の深堀り、ライセンスの考え方などを図を用いて解析していますので、気になる方はぜひチェックしてみてください。
6. Microsoft Fabricの始め方
Fabricの始め方は3つのパターンがあります。自社に合った方法を選択しましょう。
パターン① Power BI Premium容量を購入する
月額固定費用で始めたい場合は、Power BI Premium容量を購入しましょう。
すでにお持ちの場合は有効化されているはずです。
パターン② 無料試用版のFabric容量を使ってみる
管理ポータルで試用版の設定を有効化すると、60日間の試用版のFabric容量と最大1TBのOneLakeストレージが利用できます。
パターン③ Azure Portalからプロビジョニングする
従量課金制が良い際は、Azure PortalからFabric容量を作成し、ワークスペースを容量に割り当てることで利用を開始できます。
Microsoft Fabric、興味はあるけれど自分だけで始めるには不安だ…という方は、ぜひ一度ご相談くださいませ。
データ専任エンジニアがサポートさせていただきます。
ご相談はコチラ
7. まとめ
ここまでで、Microsoft Fabricの概要、特長、できる事からコストの考え方まで解説してきましたがいかがでしたでしょうか?
Microsoft Fabricは…
- 次世代の「SaaS型データ分析ツール」
- データ活用に必要な機能を1つのプラットフォームに実装している
- OneLakeによりデータの一元管理が実現されている
- SaaSである点と、データ仮想化を実現する点が他のAzureデータサービスと大きく異なる
- 月額固定制と従量課金制、2つの課金方法がある
です。
Microsoft Fabricは唯一のデータ活用基盤として企業のデータ活用に貢献します。
例えば、生成AI導入後によくある「精度を向上させたい」「もっとデータソースを増やしたい」といったニーズに対応できるソリューションとしても注目されています。
2024年10月2日(水) には、そのようなお悩みを持った方に向けて“自社データを活用する”データ・AI活用について解説するセミナーを開催します。
MicrosoftのデータAIスペシャリストが登壇、セッション内でFabricについてご紹介しますのでぜひチェックしてみてください!
\ マイクロソフトのスペシャリストが登壇! /
AIの力を最大限引き出すデータ活用基盤とは?
~ “効果が出ない”から”自社データを活用できる”にステップアップする方法を解説~
今後、詳しい技術情報も併せて公開していければと思いますので、ご興味お持ちいただきましたらぜひチェックしてみてくださいね。
この記事を書いた人
- 鈴木梨玖
-
マーケティング担当の鈴木です。
VDIやDataAI製品を中心に、セミナー、ブログ、メルマガなどで情報を発信しています!
よろしくお願いいたします_(._.)_
この投稿者の最新の記事
- 2024年5月22日ブログMicrosoft Build Day1キーノートまとめ(日本語)
- 2024年2月16日ブログChatGPTを使いこなす!活用例をご紹介
- 2024年2月9日ブログChatGPT?Copilot?良く聞くAIサービスの違いを解説!
- 2024年2月2日ブログ[速報]オンプレミスで動くAzure Virtual Desktop!AVD for Azure Stack HCIが一般公開