Data+AI Summit 2023 基調講演 Day1 (6/28)

powered by 日商エレクトロニクス

data+ai summit 2023

こんにちは、日商エレクトロニクスのマーケティング担当 鈴木です。

「生成AI は未来を作るもの。今我々は地球の未来を作る特別な時期にいる。」
と壮大に始まった、6/28の 基調講演(Keynote) Day1。
本記事ではそれぞれのセッション前半部分をメモもかねてまとめたいと思います。(後々セッション聞き直して更新していきます!)

Data+AI Summit 2023の公式サイトはコチラ >
Data+AI Summit 2023 まとめサイト powered by 日商エレクトロニクスはコチラ > 

●こんな方におススメ

  • Data+AI SUMMIT 2023 基調講演の内容を日本語でササッと理解したい


1. 前提

まずはdatabricks社の考え方を整理します。
この後の話や製品アップデート情報が頭に入りやすくなるかな、と思います。

AIは着実に発展しており、それは人間の生産性向上やさらなる価値の創造につながる。

しかし技術だけではそれを達成するのは難しく、誰もが同じように使える「民主化」を実現する必要がある。(インターネットは世の中を大きく変えましたが、その前に”専門知識が無くても誰でも気軽に利用できる”状態になっていますね。)

その中でdatabricks社は
データ:すべての従業員に民主化
AI:すべてのプロダクトで民主化
を目指しています。

それでは、次からはキーノート1日目の内容です!

2. Microsoftの考え

Microsoftは長年AIに取り組んでいる。その中での考えを発表した。

AIのトレーニングワークロードは非常にデータ依存性が高く、同期的ではなく、過去のワークロードとは異なるため、Azureが最適なインフラであるよう戦略を再考している。

AI市場が盛り上がっている一方で、課題もある。
まず、児童労働、公害、間違った情報、著作権侵害、情報漏洩問題…。これらが、生成AIによる加速され、サーバーリスクやバイオテロ等々を引き起こす可能性がある。
その中で「責任あるAI」が求められており、Microsoftはそこに注力している。

この先5年間のビジョンについて、DatabricksとAzureのコンピューティングを使用した生成AIの活性化に意欲的に取り組んでいる。
Microsoft製品で言うと、例えば「Power BI」では自然言語を使えるようになる、などBI分野にも自然言語を活用できたらさらにパワフルになる。
VS Code Extensionも素晴らしい。OpenAIも発展している。

3. なぜ今、生成AIがテーマになっているのか

現在、なぜ生成AIがこのように注目を集めているのか?
これについて考えるうえで、私たちは過去を振り返ってみる必要がある。

コンピューティング技術は40年前には既に存在していたが、80年代まで一般家庭で普及することはなかった。
しかし、パーソナルコンピュータの登場により、ITの民主化が進んだ。

同様に、インターネットブラウザも当初は誰も使用していなかった。
しかし、Webブラウザーの発明により、インターネットは一般に利用可能になった。

そして、ディープラーニング技術も12年前には実現されていたが、最近になって非常に注目されるようになった。

AIも何かのテクノロジーのよって民主化を進める必要がある。
今の課題はデータとAIが分離されていること。これを統合する必要がある。
一般的に普及しているDWHにはBI機能があるが、AI用の非構造化データには対応していない。

そのため、databricksはLakehouseと呼ばれるアーキテクチャを提供している。Lakehouseは、Apache Sparkエンジン上に構築され、ストリーミングデータやバッチ処理を含む、さまざまな形式のデータを統合的に扱える。
また、マルチクラウド環境でも利用可能であり、AWS、Microsoft Azure、Google Cloud Platformなどのクラウドプロバイダーで動作する。

レイクハウスは、多くの人々に利用されており、今年で10,000人以上のユーザーが存在しています。私たちは、データとAIを一体化し、高度な予測分析を行うことにより、ビジネスや社会問題の解決に貢献することを目指している。

4. JP MORGAN CHASE & COのAI/MLの大規模活用

JPMORGAN CHASE & COは「データ駆動型企業」。500PBものデータを扱っている。(ChatGPTに質問したら、5GBずつ区切ってDVDに焼いた場合、エベレストよりも5倍高いことがわかったそうです!)

BIツールへの投資も行っており、15年以上前から伝統的なアナリティクスを行っている。

近年では特にAI/MLプレディクティブにも取り組み、オペレーションの効率化や不正検知にも活用している。顧客向け、パーソナル化したサービスを提供するためにこの技術を活用している。
(具体的には、Delta LakeやDelta Sharingを活用してデータの可視化や分析を進めているとのことです)

生成AIの民主化に向けても取り組んでおり、すべての従業員がテクノロジーを理解するように努めている。
ChatGPT活用できるようになったことでPython、Scala、SQL 開発者全員と同じになった、と主張している。

もうプログラミングの知識は必要ない、英語(自然言語)さえわかればデータ活用できる。

また、同様に重要なのはデータ周辺の仕組みである。
規制が高い企業だと、そのデータがどこから来ているのか、それをどこに着地させるのか、どのように使うのかということを気にする。
そこで諮問機関とデータサイエンティストの能力と合わせることによって、最適な運用ができるようになる。

5. 生成AIでイノベーションを起こすには?

生成AIを高度な技術にするためにはどうしたらよいか?
民主化する必要がある。言語が理解できれば、AIに命令することができる、という状態にすることで実現できる。

今、AIはすべての製品に組み込まれることになり、SQLなどがわからなくても使えるようにするための方法についても検討されている

「最も人気のあるプログラミング言語は「英語(=自然言語)」だ」という状態が目指す場所。

しかしこれはどのドメインでも難しい。LLMをアシスタントとして使ってもうまくいかない。
意味のある返答をするには、コンテキストや利用者の背景を理解する必要があるため。(同じ意味でも違う言葉を使ったりしますよね。会社用語や内部用語もあります。)

LakeHouse IQは、背景や用語、前後のつながりを理解して分析結果を返すことができることで、このような課題を解決する。

▼画面右下、アシスタント機能でどのようなコードを書けば知りたい情報が出るかレコメンドしている

▼エディタの中でも、自然言語で結果が返ってくる

▼「なぜ5月に数字が落ち込んでいるのか?」という自然言語での質問にdatabricksが分析結果を応答している。

この記事を書いた人

鈴木梨玖
マーケティング担当の鈴木です。
VDIやDataAI製品を中心に、セミナー、ブログ、メルマガなどで情報を発信しています!
よろしくお願いいたします_(._.)_