07/23/2024

Part 1:スノーフレイク(SNOW)データプラットフォーム市場の覇権争いの行方は?競合他社とテクノロジー上の競争優位性を徹底分析!

a blue and white logoコンヴェクィティ  コンヴェクィティ
  • 本シリーズでは、スノーフレイク(SNOW)とDatabricksの最新の年次サミットを詳しく検証した分析をお届けします。
  • 本稿であるPart 1では、モダンデータスタックの主要プレーヤーを総括し、主要なトレンドを議論し、クラウドデータウェアハウスの進化を概説します。
  • これは、Part 2でのスノーフレイクとDatabricksのオープンフォーマット戦争に関するより深い議論の基礎となります。
  • また、Part 2ではAIプラットフォーム・アズ・ア・サービス(AI Platform-as-a-Service)に関する見解を共有し、Part 3ではスノーフレイクに関する具体的な考察と最新のバリュエーションをお伝えします。

スノーフレイク(SNOW)とデータプラットフォーム市場

スノーフレイク(SNOW)とDatabricksの年次サミットが開催されてから1か月が経ちました。これらの企業とアマゾン(AMZN)のAWS、マイクロソフト(MSFT)のAzure、アルファベット(GOOG/GOOGL)のGoogle Cloud Platform(GCP)などのハイパースケーラーによって主導されるModern Data Stack(MDS)の成熟が見られます。これにより、製品の進化が鈍化し、毎年の革新的なニュースが減少しています。

※Modern Data Stack(MDS):データの収集、処理、保存、分析を行うための最新のテクノロジーとツールのセットのこと。従来のデータスタックと比較して、MDSはクラウドベースであり、スケーラビリティ、柔軟性、そしてリアルタイム分析の能力が向上している。

サミットからは、データエステートの管理と生成AIの未来を勝ち取るという2つの主要な変化が浮き彫りになりました。これらのフォーカスされた領域において、特にスノーフレイクとDatabricksの間でデータプラットフォームプレイヤー間の競争が激化しています。

※データエステート(Data Estate):組織が所有する全てのデータ資産と、それに関連するインフラストラクチャ、ツール、プロセスの全体のこと。これは、企業がデータを収集、保存、管理、分析するための包括的なエコシステムを形成する。

※データプラットフォーム:データの収集、保存、処理、分析を行うための統合されたシステムまたは環境のこと。このプラットフォームは、データのライフサイクル全体をサポートし、組織がデータから価値を引き出すのを助けるためのツールと技術のセットを提供している。

現在、データプラットフォーム市場はスノーフレイク、Databricks、AWS、Azure、GCPの5つの主要プレイヤーによって支配されています。ハイパースケーラーは、IaaSよりも差別化、ロックインの可能性、高いマージンを提供するData Platform-as-a-Service(PaaS)を提供することに価値を見出しています。

※ハイパースケーラー(Hyperscaler):大規模なデータセンターを運営し、クラウドコンピューティングサービスを提供する企業のこと。

※IaaS(Infrastructure as a Service):クラウドコンピューティングサービスの一形態であり、仮想化されたコンピューティングリソースをインターネット経由で提供するもの。IaaSは、企業や開発者が物理的なハードウェアを購入、管理、保守することなく、必要なコンピューティングリソース(例:サーバー、ストレージ、ネットワーキング)を利用できるようにする。

※Data Platform-as-a-Service(PaaS):データ管理、分析、および関連するサービスをクラウド上で提供するプラットフォームサービスのこと。

また、データストリーミングのコンフルエント(CFLT)、データメッシュのStarburst、CRMデータを活用するセールスフォース(CRM)、ClickHouseベースのソリューションなどの新たな競争相手も台頭しています。この多様化は、包括的なデータ管理ソリューションの重要性が増していることを示しています。

※ClickHouse:高速でスケーラブルなオープンソースの列指向データベース管理システムのこと。特にオンライン分析処理(OLAP)に適しており、大規模なデータセットに対して非常に高速なクエリ性能を提供している。ロシアのYandexが開発し、現在は広く利用されている。

では、各プレイヤーの概要を見てみましょう。

スノーフレイク(SNOW)

スノーフレイク(SNOW)はクラウドネイティブのウェアハウスウェーブとMDSムーブメントを先導しました。AWS Redshiftとは異なり、スノーフレイクはコンピュートとストレージを分離し、パフォーマンス/コストを10倍以上改善しました。この革新により、クラウドデータウェアハウスはデータ運用の中心化のための明確な選択肢となりました。

※クラウドネイティブ(Cloud Native):クラウドコンピューティング環境を最大限に活用するために設計されたソフトウェアアーキテクチャおよび開発方法論のこと。クラウドネイティブアプローチは、クラウドインフラストラクチャの特性を活かし、スケーラビリティ、柔軟性、高可用性、迅速なデプロイを実現することを目指している。

※Amazon Redshift:Amazon Web Services (AWS) が提供する完全マネージド型のデータウェアハウスサービスのこと。

※クラウドデータウェアハウス(Cloud Data Warehouse):データを収集、保存、管理、分析するためのデータウェアハウスがクラウド環境で提供されるもの。

スノーフレイクはプラットフォームに依存せず、売上高の大部分はAWSから、次にAzure、GCPから得ています。スノーフレイクはデータウェアハウス分野で、データガバナンス、共有、クリーンルームなどの機能を備えた優れたデータレイヤーに基づいており、MDSにおけるリーダーシップを確固たるものにしています。

※クリーンルーム:データ共有およびコラボレーションのための安全な環境のこと。クリーンルームは、複数のパーティ(例:企業、ビジネスパートナー、データプロバイダー)がプライバシーやコンプライアンスの懸念を排除しながらデータを安全に分析・共有できるように設計されている。

Databricks

Databricksはビッグデータコンピュートとデータサイエンス/ML(機械学習)の成長を推進しました。Apache Sparkの商業的主体であるDatabricksは、インメモリコンピューティングを通じてビッグデータ処理をより効率的にしました。

※Apache Spark:大規模データ処理を行うためのオープンソースの分散処理システム。Apache Sparkは、データのバッチ処理とストリーム処理の両方に対応しており、従来のHadoopのMapReduceに比べて高速にデータを処理することができる。

※インメモリコンピューティング(In-Memory Computing)とは、データをディスクではなく、メインメモリ(RAM)に保持して処理する技術のこと。

※ビッグデータ:従来のデータ処理技術や手法では処理が困難なほど、大規模かつ複雑なデータセットのこと。

DatabricksはSpark-as-a-Serviceを提供しており、最初はETLプロセスに使用されていましたが、現在ではMLワークロードでも人気があります。最近、Databricksはデータウェアハウス市場にも進出し、350百万ドルのARR(年間経常収益)を達成しました。売上高の大部分はAzureから来ていますが、AWSの貢献も増えています。

※Spark-as-a-Service:Apache Sparkの分散データ処理機能をクラウドベースで提供するサービスのこと。これにより、ユーザーは自身のインフラストラクチャを管理することなく、クラウド環境でSparkの強力なデータ処理能力を利用できる。

※ETLプロセス:データの抽出(Extract)、変換(Transform)、ロード(Load)の各ステップを通じて、異なるデータソースからデータを収集し、それを分析やレポーティングに適した形式に整えて、最終的にデータウェアハウスやデータマートにロードする一連のプロセスのこと。

※MLワークロード(Machine Learning Workload):機械学習モデルの開発、トレーニング、評価、デプロイ、および推論に関連する一連のタスクとプロセスのこと。

AWS(AMZN)

アマゾン(AMZN)のAWSはRedshiftとElastic MapReduce(EMR)を使って最初のクラウドデータウェアハウスを立ち上げましたが、その革新を完全には活用せず、パフォーマンス/コストとユーザー体験の面でスノーフレイク(SNOW)に後れを取りました。

※Amazon Elastic MapReduce(EMR):Amazon Web Services(AWS)が提供するクラウドベースのビッグデータ処理サービス。EMRは、Apache Hadoop、Apache Spark、HBase、Presto、Flinkなどのオープンソースビッグデータフレームワークを使用して、大規模データの処理と分析を簡単に行えるようにするためのプラットフォーム。

AWSは現在、スノーフレイクとの協力的なアプローチを採用しており、スノーフレイクの成功がAWSのIaaS消費にとって有益であると見ています。AWSは、包括的なデータスタックスイート(Glue Catalog、S3、EMR、Redshift、Athenaなど)を備えたAWS専用のスタートアップにとって魅力的な存在です。

※データスタックスイート(Data Stack Suite):データの収集、処理、保存、分析、可視化に関わる様々なツールや技術を統合した一連のソリューションのこと。これらのツールは、データライフサイクル全体をサポートし、データ駆動型の意思決定を促進するために使用される。

Azure(MSFT)

サティア・ナデラ氏の下で、マイクロソフト(MSFT)のAzureはAI、セキュリティ、ファーストパーティPaaSおよびSaaS提供に焦点を当てた主要なクラウドプレイヤーとなりました。Azure DatabricksはファーストパーティPaaSとして非常に成功しており、大規模なR&DなしでマイクロソフトがDatabricksの革新を活用できるようにしています。

マイクロソフトのデータプラットフォームであるFabricは、Databricksの製品とマイクロソフトの製品(PowerBIなど)を組み合わせ、包括的なデータスタックを構築しています。Fabricは競争力のある価格設定と機能により、特にビジュアライゼーション、AI、大規模データ処理の分野でマイクロソフトの顧客に対して成功する可能性があると見ています。

Google Cloud Platform / GCP(GOOG / GOOGL)

アルファベット(GOOG/GOOGL)は最初にクラウドデータウェアハウスを先駆けましたが、その技術を内部に留めました。GCPの主要な売りは、アルファベットの内部ツールに基づいたPaaS製品(BigQueryなど)です。高度な技術を持ちながらも、BigQueryの商業化は遅れ、現在はGCPエコシステムに限定されています。

※BigQuery:Google Cloud Platform(GCP)が提供する完全マネージド型のデータウェアハウスおよび分析サービスのこと。ビッグデータの処理と分析を迅速に行うために設計されており、特に大規模なデータセットに対してSQLクエリを高速に実行できる点が特徴。

GCPには、包括的な変革を推進するマイクロソフト(MSFT)のナデラ氏のような強力なリーダーが欠けています。BigQueryは現在、外部テーブルをサポートしていますが、依然としてスノーフレイクに対して防御的な立場を維持しています。このアプローチは、GCPが変化に対してマイクロソフト以上に抵抗していることを示しています。

スノーフレイク(SNOW)を取り巻く主要トレンド

主要プレイヤーが成熟し、従来のオンプレミスソリューションが衰退しています。以下は主要なトレンドです。

※オンプレミスソリューション:企業や組織が自社の施設内に設置し、管理するITインフラストラクチャやソフトウェアソリューションのこと。これには、サーバー、ストレージ、ネットワーキング機器、ソフトウェアアプリケーション、データベースなどが含まれる。

キュレートされたデータの利用拡大:データ共有、クリーンルーム、ガバナンス、セキュリティ、リバースETL、新たなアプリケーションを含むキュレートされたデータの利用拡大。

オープンスタックの開発:データスタックをよりオープンにし、データフォーマットをコンピュートエンジンから分離し、相互運用性を促進。

AI統合とネイティブAI製品:ネイティブAIコパイロット、AI駆動のコード生成、組み込みベクトルデータベース、AIオペレーションPaaS、統合プラットフォームによるAI統合の加速。

※キュレート(curate):情報やコンテンツを収集、整理、選定し、特定の目的やテーマに沿って提供するプロセスのこと。

※リバースETL(Reverse ETL):データウェアハウスやデータレイクに保存された分析データを、再び運用システムやツールに戻して活用するプロセスのこと。従来のETL(Extract, Transform, Load)がデータをソースシステムから抽出し、変換してデータウェアハウスにロードするのに対し、リバースETLはその逆のプロセスを実行する。

※ネイティブAIコパイロット:特定のソフトウェアやプラットフォームに直接統合されているAIアシスタントまたはAIツールのこと。このAIコパイロットは、ユーザーの作業を支援し、生産性を向上させるために設計されている。

スノーフレイク(SNOW)とクラウドデータウェアハウスのさらなる進化

構造化データとガバナンスにおけるスノーフレイク(SNOW)の優位性は、Databricksの動向からも確認できます。DatabricksはPhotonを中心にガバナンスエンジンを標準化し、データウェアハウスエンジンを立ち上げました。SQLエンジンが成熟するには8〜10年かかりますが、Databricksの急速なARR(年間経常収益)の拡大は実験的な側面があるかもしれません。Photonは当初、複数の同時ユーザーや大規模データセットに対する課題がありました。

※Photon:高性能なクエリエンジンで、Apache Sparkの上に構築されている。Photonはインメモリコンピューティングを利用して、データ処理と分析の速度を大幅に向上させることを目的としている。

※クエリエンジン:データベース管理システムやデータウェアハウスに対してクエリを実行し、必要な情報を取得するためのソフトウェアコンポーネントのこと。具体的には、クエリエンジンはSQL(Structured Query Language)やその他のクエリ言語で記述されたクエリを解析し、データを効率的に検索、抽出、変換、集約する役割を担う。

Databricksはデータガバナンスで追いつきつつありますが、クリーンルーム、データ共有、マーケットプレイスの分野では依然としてスノーフレイクに遅れを取っています。そして、現在の競争の焦点はカタログ開発に移っています。DatabricksはPhotonとUnity Catalogを組み合わせたアプローチを採用し、スノーフレイクはApache Iceberg用のPolaris Catalogで対抗しています。

※Unity Catalog:Databricksによって提供されるデータガバナンスソリューションで、データのカタログ化、ガバナンス、セキュリティを一元的に管理するためのプラットフォーム。Unity Catalogは、Databricks上でデータ資産をより効率的に管理し、アクセス制御やデータセキュリティを強化するために設計されている。

※Apache Iceberg:ビッグデータのエコシステムにおいてデータ管理のために設計されたオープンソースのテーブルフォーマット。Icebergは、特に大規模なデータセットに対して効率的で信頼性の高いデータ操作を可能にすることを目指している。

※Polaris Catalog:スノーフレイクが提供するデータカタログであり、特にApache Icebergテーブル形式をサポートするために設計されている。Polaris Catalogは、データ管理、発見、ガバナンスを一元的に管理し、スノーフレイクプラットフォーム上でのデータ操作を強化するための機能を提供している。

Databricksは、Delta LakeのApache Icebergとの互換性を向上させるためにTabularチームを買収しました。このシフトは相互運用性を目指し、Delta Lakeの市場採用の課題に対処するものです。Polaris Catalog対Unity Catalogの成功は、注目すべき主要なトレンドとなるでしょう。

※Delta Lake:オープンソースのストレージレイヤーであり、ビッグデータのための信頼性の高いデータレイクを構築するために設計されている。Delta Lakeは、Apache Sparkと完全に統合されており、データの一貫性、信頼性、およびパフォーマンスを向上させる機能を提供している。

※Tabular:Apache Icebergプロジェクトに深く関与している企業であり、Icebergの開発と普及を推進している。Tabularは、Icebergのエコシステムを強化し、データレイクの管理と運用を簡素化するためのツールとソリューションを提供。

まとめると、データプラットフォームの市場は成熟するプレイヤー、新たな競争相手、キュレートされたデータ利用、オープンスタックの開発、AI統合といった主要トレンドと共に進化を続けています。

その他のテクノロジー銘柄関連レポート

1. ① Part 1:クラウドフレア / NET:サイバーセキュリティ銘柄のテクノロジー上の競争優位性(強み)分析と今後の将来性(前編)

2. ①ルーブリック / RBRK(IPO・新規上場):サイバーセキュリティ銘柄の概要&強み分析と今後の株価見通し(Rubrik)

3. パロアルトネットワークス / PANW / 強気:サイバーセキュリティ銘柄のテクノロジー競争優位性分析と将来性 - Part 1

また、私のその他のテクノロジー関連銘柄のレポートに関心がございましたら、是非、こちらのリンクより、私のプロフィールページにアクセスしていただければと思います。

さらに、その他のスノーフレイク(SNOW)はに関するレポートに関心がございましたら、是非、こちらのリンクより、スノーフレイクのページにアクセスしていただければと思います。

弊社がカバーしている企業・銘柄の一覧ページはこちら