セキュリティが不安~Azure Open AIアプリのセキュリティベストプラクティス①


皆さん、こんにちは。

最近行けるだけのセミナーに行くことが多いのですが、そろそろAIを活用したアプリケーションの開発したいと考えている企業が非常に多いです。

ただ、AIをクラウドで利用するセキュリティへの不安から、踏みとどまっている企業さんも非常に多いです。

そこで、今回はMicrosoftから発表されているセキュリティのベストプラクティスをご紹介したいと思います。ページそのものもボリュームがあるので、「データセキュリティ」部分を抜粋したいと思います。

こちらからも、確認できますので是非アクセスしてみてください。

Security Best Practices for LLM Applications in Azure (microsoft.com)

 



1. ゼロトラストについて

Microsoft Azureのセキュリティ領域において、欠かせないキーワードになっているのが「ゼロトラスト」です。Azure Open AIだけでなく、様々なソリューションでもこの「ゼロトラスト」という言葉が利用されています。では、ゼロトラストとはどういう意味なのでしょうか。

ゼロトラストとは、脅威が外だけでなく、内にも脅威があるものとみなしてセキュリティ対策を考えます。なので、社内ネットワークの外にいようが、内にいようが、アクセスする場合は常に認証・承認、そして通信が暗号化されている必要があります。

よくゼロトラストの対比として使われる言葉が「境界型」と呼ばれるセキュリティ対策です。境界型は社内ネットワークを信用されるもの、社外ネットワークを信頼できないものとして区別する考え方です。

社外・社内の境界にファイルウォール等の製品を置いて、社外からの攻撃を防ぎます。

是非この機会にゼロトラストについて覚えていただければと思います。

2. Azure OpenAIにおけるデータセキュリティ

今回お話しするデータセキュリティとは、LLMの学習、及び問い合わせに利用されるデータ、またLLMから生成されたデータの保護になります。データの機密性、完全性、可用性を確保することに加えて、データプライバシーと規制要件を目指します

まずは、全体構成は下図になります。ネットワーク全体構成はハブ&スポーク構成、かつ先ほど紹介したゼロトラストという考えをもとに構成されています。

 

2-1. データ種別毎のラベル分け

データ保護をするうえで重要になるのは、データを用途や重要度をもとにラベル分けをすることです。例えば、個人情報や財務データ、機微な社内データを特定し、適切な暗号化とアクセス制御を実装します。

データの種別・ラベル分けをサポートしてくれるソリューションが「Microsoft Purview」です。

Microsoft Purviewは自動的にデータのラベル分けをサポートし、環境内の横断的なデータガバナンスを維持させることができます。これにより、Azure OpenAI/LLMを活用した環境でも保護された状態で利用することが可能になります。

2-2. 休止中/転送中の暗号化

転送中はイメージできるかと思いますあ、休止中は少々馴染みのない言葉かもしれません。休止中の暗号化は、保存されている状態のデータを暗号化することです。

その休止中の暗号化をサポートしてくれるAzureソリューションが「Azure Storage Service Encryption」と「Azure Disk Encryption」です。そして、暗号化する際に利用するキーなどを保存する選択肢として、「Azure Key Vault」を利用することができます。

転送中は、TLSによって保護化され、強制的にセキュアな通信のプロトコルが選択されます。

2-3. RBAC(ロールベースアクセスコントロール)

こちらの考えもAzure OpenAIだけでなく、Azure全体で適用が推奨されています。ユーザーに適切な権限を割り当て、役割や責任に基づいてアクセスを制限します。定期的にアクセス制御を見直すことで、セキュアな環境を維持します。

2-4. データマスキングとデータレダクション

データマスキングとは、本物と同じデータ構造で作られた偽物のデータと置き換えることです。データレダクションは個人情報や機密情報などの特定のデータを削除したり、隠したりすることです。

データマスキング、もしくはデータレダクションにより、機密性やプライバシーを保護するために利用されます。

そのため、Azure OpenAI環境で検証、もしくはトラブルシューティングする場合は、必ずデータのマスキングもしくはレダクションを活用します。

2-5. データバックアップとディザスタリカバリー(DR)

重要なデータを定期的にバックアップし、コピーしておくことで、データの損失やシステムに障害が発生した場合でも、データの可用性や回復性を確保することできます。「Azure Backup」や「Azure Site Recovery」のサービスを活用することで実装することができます。

2-6.  脅威検知と監視

環境そのものに対する脅威検知、及び監視をするツールとして利用できるのが「Azure Defender(CWWP)」であり「Azure Sentinel(SIEM)」です。

Azure Defender を利用して、セキュリティの脅威を検出し、対応します。また、監視とアラートの仕組みを設定して、不審な活動や侵害を特定します。Azure Sentinel を活用して、高度な脅威検出と対応を行います。

2-7. データ保持と破棄

コンプライアンス規制に準拠するため、データ保持と廃棄のポリシーを策定する必要があります。不要になったデータに対して、安全な削除方法を手順化し、データ保持と廃棄の活動の監査方法も合わせて作成します。

データ保持と廃棄は、データの機密性やプライバシーを保護するために行われるプロセスになります。

2-8. データプライバシーとコンプライアンス

存在するデータ保護規制(GDPR や HIPAA など)に準拠するために、プライバシー管理を実施し、データ処理活動に必要な同意や許可を得ます。

プライバシー管理とは、データの収集、使用、保存、開示、削除などのプロセスにおいて、データの機密性やプライバシーを保護するための原則や規則を実施することです。

2-9. 定期的なセキュリティ評価

LLM アプリケーションのデータセキュリティ対策におけるセキュリティの弱点や脆弱性を発見し、対処するために、定期的にセキュリティ評価、脆弱性診断、ペネトレーションテストを実施します。

そのためにも、「Azure Defender(CWWP)」であり「Azure Sentinel(SIEM)」は有効なツールになります。尚、こちらはAzure環境(テナント)に適用させることがツールであり、Azure OpenAIのみならず、全体を保護することが可能です。

2-10. 従業員への教育とデータガバナンス/セキュリティに対する理解

データセキュリティのベストプラクティスや、データを安全に扱うことの重要性、データ侵害に関連する潜在的なリスクについてしっかりと教育、周知する必要があります。

データセキュリティのルールをしっかりと守ってもらうため、まずは従業員が納得してもらうルールから設定しましょう。

 

これ以上はボリュームがとんでもないことになってしまうため、今回はここまでです。全てを紹介しきれなかったため、次回に・・・

この記事を書いた人

森 信之介
テクニカルマーケターとして、ブログ執筆、セミナー講師を行っております!