データ分析基盤をクラウドで!
事前に知っておきたい検討ポイントとは?
データ量の増加や市場の変化にいち早くついていくために、データ分析基盤の見直しをお考えではないでしょうか?
データ量の増減に柔軟に対応できる、AI活用ができる、という理由でクラウドでの見直しを検討している方も少なくないかと思います。
しかし、クラウドで検討する際の注意点がわからない、クラウドでのデータ分析基盤について知識が不足している…とお困りの声を多くお伺いします。
そこでそのような方のお悩みを解決できるよう、2章仕立てでクラウドにて検討を進める際のヒントとなる情報をまとめてみました。
第1章:事前に知っておきたい検討ポイント←イマココ
第2章:オンプレからクラウドへ!データ分析基盤刷新の進め方を解説
ぜひご参考にしていただければ幸いです。
こんな方におススメ
- オンプレミスのデータ基盤を持っていて、クラウドへ移行することを検討している
- オンプレミスで保有しているデータをクラウドで実現したいと考えている
- クラウドデータ基盤を検討するうえでどのような注意点があるのか知りたい
- クラウドで検討するうえでの前提情報が知りたい
目次
1. データ分析基盤に必要な要素とクラウドでの実現方法
1-1. データ分析基盤に必要な要素
「データ分析基盤」とは、社内外で抱える利用可能なデータを、ビジネスで利活用するための技術的基盤を指します。
そのメリットとしては、
- 一貫してデータ収集から分析までできること
- 人手に頼らない・属人化を防げること
- データを一元管理し質を担保できること
などが挙げられます。
そしてそのデータ基盤を構成する要素としては、データ分析のプロセスに対応する以下の3つが必要です。
①データの取り込み
オンプレミス、クラウド上のアプリケーションやデータベース、ストレージなどに散在するデータを収集し保存します。具体的な要素としては「データレイク」が該当します。
②データの加工可視化
ローデータを分析しやすいように整形、加工、クレンジングします。加工したデータはグラフ化するなど可視化されます。「データウェアハウス」や「BIツール」が該当します。
③データの分析
目的に合った結果が出せるよう分析手法を定めて、分析ツールを活用するなどして分析結果を導き出します。「データマート」や「BIツール」が該当します。
1-2. クラウドで構築する場合の選択肢
前述の様なデータ分析基盤をクラウドで実現する方法としては、
- IaaSで構築する
- PaaSで構築する
という2つの選択肢があります。
それぞれの特長を簡単にまとめると、下記のようになります。
IaaS | PaaS |
---|---|
• 既存環境を“そのまま”クラウドに持っていきやすい • ハードウェアの調達が不要でオンプレミスに比べて運用管理負荷が減る |
• DX推進のためのデータ分析基盤におススメ • インフラ、プラットフォームがそろった状態から開発に取り掛かれるため開発スピードが向上する • 運用管理範囲が狭く、データ・アプリケーション以降のみ見ればよい |
詳しくは次の章から3つの観点で解説していきます。
2. データ分析基盤をクラウドで構築するメリット
それでは、ここからはクラウドのメリットと、IaaSとPaaSそれぞれの特長を整理していきましょう。
メリット① アプリケーションリリースのスピードが上がる
DXを推進することにおいて、短時間で高度な機能を導入できることが重要ですよね。
クラウドは、開発に必要な物理リソースの用意が不要なためオンプレと比べてリリースまでの時間を短縮することができます。
そして、IaaSとPaaSを比較した際に優れていると言えるのはPaaSです。
IaaS | PaaS |
---|---|
基盤のサーバの構築、日本語化、ウェブサーバーソフトのインストール…と 多々段階を踏む必要がある |
インフラ、プラットフォームがそろった状態から開発に取り掛かれる |
例えばwebサーバの開発を行う場合を想定します。
IaaSを利用した場合、物理リソースの用意は不要ですが、アプリケーションの開発までには基盤のサーバの構築、日本語化、ウェブサーバーソフトのインストール…と多々段階を踏んだ後に取り掛かることになります。
対してPaaSを利用した際には、手間のかかるインフラ、プラットフォームがそろった状態から開発に取り掛かることができるため、大幅な開発の効率化が実現できます。
さらに、その他PaaSやSaaSとも簡単に連携できますので、機能のアドオンも柔軟に行えます。
メリット② スモールスタートで必要に応じた拡張が簡単
DXという漠然としたゴールを達成するには、「スモールスタートを容易に実現できる」「必要に応じて拡張できる」ことが重要です。
そして、これはまさにクラウドのメリットがそのまま生かせる点です。
ストレージ容量だけでなく、パフォーマンスに関わってくる部分も数クリックですぐに拡張できるのはクラウドならではのメリットです。
IaaS | PaaS |
---|---|
・簡易に容量を拡張できる ・CPU/メモリなどのパフォーマンス性能の拡張も容易 |
これはIaaSもPaaSも違いは無く、どちらも柔軟なスペック変更が可能です。
メリット③ DXへの投資を増加できる
IT関連費用の大半を担っている運用/保守コストを削減することは、DX人材、DXにかけられる時間を増加させ、DX化を促すために必要な観点です。
クラウドは、オンプレと比べて運用管理範囲が狭いので必然的に運用保守コストを下げることができます。
IaaSとPaaSを比較した際には、より運用管理範囲が狭いPaaSの方がDXへの投資を増加と言えます。
IaaS | PaaS |
---|---|
サーバの作成~運用保守をする必要あり | データ以降の部分のみ面倒を見れば良い |
IaaSはゲストOSから自社で管理する必要がありますが、PaaSはデータとアプリケーションのみにフォーカスして管理をすればいいため、システムの管理コストを大幅に下げることができるのです。
3. IaaSとPaaSはどちらを選べばよい?
3-1. 費用対効果も考える
結論、社内のデータ活用やDXを進めるうえでは基本的にPaaSがオススメです。
上記で言及したメリットの大きさももちろんですが、「ただ単にIaaSに移行しただけでは費用対効果が出ない可能性がある」からです。
実際、IaaSでの全移行を検討してPoCをしたところ、移行コストがかかるだけであまりメリットを見いだせない、ということが判明し急遽PaaSへの刷新に切り替えた企業様もいらっしゃいます。
PaaSを利用することで、費用対効果を出すだけでなく、よりDXを推進しやすいアーキテクトを実現することができます。
なので、データ分析基盤のクラウド化をご検討の際には、ただの「クラウド移行」ではなく「PaaSも活用した刷新」ととらえて頂く必要があります。
3-2. PaaS検討時の注意点
ただし、ただやみくもにPaaSにすればOKという訳でもありません。
PaaSによりプラットフォームの構築/運用が不要になる代わりに、機能に制限が出る可能性があるからです。
下記のポイントをご確認いただいた上で「PaaSではやりたいことが実現できない」となった際は、IaaSも考慮に入れていただくのも1つの手かと思います。
【PaaS化におけるチェックポイント】
ポイント① オンプレミスとPaaSにどのくらいの機能差異があるか
現在活用しているオンプレミス基盤とPaaSの機能を比べて機能差異があるか確認しましょう。
ポイント② 機能差がどう業務に影響するか
PaaSに機能がない場合、その機能が本当に必要なのかという点を改めてご確認ください。
今後クラウドでデータ分析を行うにあたって必要ない、と判断されたら、ぜひPaaS活用をご検討ください。
しかし、PaaSが便利だからと言って、業務に影響があるにもかかわらず利用するのは本末転倒ですのでご注意ください。
ポイント③ 使いたい機能がPaaSにあるか
今後継続的にデータ分析やDXを行う上で、利用したい機能がPaaSにあるのか確認する必要があります。
4. まとめ
本ブログでは、データ分析基盤をクラウドで検討するにあたって知っておくべき前提情報として、
- クラウドで実現するメリット
- IaaSとPaaSの比較
- PaaS検討時の注意点
を解説してきましたが、いかがでしたでしょうか?
具体的にAzureで実現するとしたらどのようなアーキテクチャになるのか、どのようにクラウド化を進めていけばよいのかどうか、は第2章以降でチェックいただければと思います。
クラウドでのデータ分析基盤の進め方について、ゼロから10までまとめて学びたい!という方には データ基盤導入入門ガイドブックもご用意しております。
Microsoft Azureで始めるデータ基盤の導入
入門ガイドブック
ぜひ、お役立ていただけましたら幸いです。
この記事を書いた人
- Azure導入支援デスク 編集部
-
こんにちは!双日テックイノベーション(旧:日商エレクトロニクス)では、Microsoft Azure活用に関する有益な情報を皆様にお届けしていきます。Azure移行、データ活用、セキュリティなどに関するお困りごとや、Microsoft Azureに関する疑問点などお気軽にご相談ください。
ブログにしてほしいネタなどのリクエストもお待ちしております。
この投稿者の最新の記事
- 2024年9月12日ブログ2024年版 最新のデータ活用基盤とは?グローバル企業の事例も紹介!
- 2024年7月16日事例Azureデータ活用基盤導入事例:第一フロンティア生命保険株式会社
- 2024年3月27日ブログデータレイクとは? ~DWHとの違い、メリット、活用例などをわかりやすく解説~
- 2024年3月6日ブログデータカタログとは?~機能、導入のメリット、導入方法まで解説~