Part 1:スノーフレイク(SNOW)のIceberg採用がもたらすテクノロジー面での競争優位性、市場シェア&競合他社分析と将来性
コンヴェクィティ- Icebergを完全に受け入れることは、スノーフレイク(SNOW)にとって総じてプラスになる可能性が高いが、いくつかの注意点がある。
- Tabularの買収は、Databricksの弱点と過去の失策を浮き彫りにしており、統合は大きな課題となるだろう。
- Icebergの将来は不確かだが、広範なエコシステムの採用により、DatabricksがDelta Lakeで採用したほぼ成功しなかった戦略を繰り返す可能性は低い。
- データカタログは、オープンストレージフォーマットの採用において大きな欠落部分である。Polaris Catalogは標準となる大きな可能性を秘めているが、Databricks/Tabularも対抗してくるだろう。
- 今回のスノーフレイクに関する三部作のレポート・シリーズのPart 1である本稿では、Icebergの採用が同社にとって何を意味するのかを議論する。
- Part 2とPart 3では、DatabricksのTabular買収がスノーフレイクに与える影響およびスノーフレイクによるPolaris Catalog導入の意味について議論していく。
スノーフレイク(SNOW)の概要
スノーフレイク(SNOW)に関する我々の最初のレポートでモダン・データ・スタック(MDS)を取り上げて以来、熱狂は頂点に達し、イノベーションのペースは急速に低下している。
※モダン・データ・スタック(Modern Data Stack, MDS):最新のデータインフラストラクチャとツール群を組み合わせて構築されたデータエコシステムのこと。
これにより、業界内での統合と淘汰が進んでいる。
結果、残ったベンダーにとって、成長が減速する中で市場シェアと顧客の関心を争う競争が激化している。
MDS分野で最もホットな話題は、ストレージ標準戦争である。
※ストレージ:データや情報を保存、管理、およびアクセスするための物理的または仮想的な領域。
Databricksは、2017年からDelta Lakeのオープンソース化により、この戦争を巧みに乗り切っている。
※オープンソース化:ソフトウェアやプロジェクトのソースコードを公開し、誰でも自由に閲覧、使用、修正、配布できるようにすること。
※Delta Lake:オープンソースのストレージレイヤーであり、既存のデータレイクに信頼性、セキュリティ、およびパフォーマンスを提供することを目的としている。
※ストレージレイヤー:データを保存、管理、アクセスするための基盤となるソフトウェアやハードウェアの層のこと。
主な出来事は以下の通りである。
2017年:DatabricksがDelta Lakeをオープンソース化
2021年:Apache Icebergがリリースされ、2022年の予測通り標準になる
※Apache Iceberg:クラウドデータレイク用に設計されたオープンテーブル形式(open table format)であり、巨大な分析データセットの信頼性とパフォーマンスを向上させるために開発された。
2023年中頃:Databricksとスノーフレイクが、それぞれUnity CatalogとHorizonというデータガバナンスおよびカタログソリューションをリリース
※カタログソリューション:商品やサービスの情報を体系的に管理・公開するためのシステムやソフトウェアのこと。
2024年6月:スノーフレイクがIceberg用のオープンソースカタログであるPolaris Catalogをリリース
その2日後:DatabricksがIcebergを手掛けるTabular社を10億ドル以上で買収することを発表
スノーフレイクの発表から8日後:DatabricksがUnity Catalogをオープンソース化し、Unity Catalog 0.1のソースコードをマイクロソフト(MSFT)の保有するGitHubで公開
スノーフレイク(SNOW)に関する重要な質問
・スノーフレイク(SNOW)はIcebergを採用することで衰退を始めるのか?
・Databricksは、Icebergのクリエイターによって設立されたTabular社を所有することで、SNOWを完全に支配するのか?
・データカタログとは何か、そしてPolaris Catalogはスノーフレイクにとって何を意味するのか?
・競争において次に何が起こるのか?
Part 1である本稿では、最初の質問に答えていきたい。
スノーフレイク(SNOW)のIcebergの採用
スノーフレイク(SNOW)はIcebergのオープンソースリリース以来、それをサポートしている。
そして、Icebergは急速に好まれる標準となった。
セールスフォース(CRM)、コンフルエント(CFLT)、Dremio、Starburstなどの主要企業は、Icebergを主要または専用のデータストレージ形式として使用している。
Databricksは、最初にそのレイク・ハウス・ストレージエンジンであるDelta Lakeを戦略的にオープンソース化した。
※レイク・ハウス・ストレージエンジン:データレイクとデータウェアハウスの特徴を組み合わせたハイブリッドなデータ管理アーキテクチャのこと。
※データレイク:大量のデータをそのままの形式で格納するための中央リポジトリ。
これにより、顧客がDatabricksに支払うことを望まなくなった場合でも、コンピュートエンジンとしてApache Sparkに切り替えることができ、オープンデータレイヤーのおかげでベンダーロックインを回避できる。
※コンピュートエンジン(Compute Engine):データ処理、計算、分析などのタスクを実行するための計算リソースを提供するソフトウェアまたはハードウェアのプラットフォームのこと。
※ベンダーロックイン:顧客を特定のベンダーの製品に依存させ、他のベンダーに切り替える際に多大なコストがかかる状態。
※Apache Spark:大規模データ処理のためのオープンソースの統合分析エンジン。データ並列性とフォールトトレランスを備えたクラスタープログラミングのインターフェースを提供。
Databricksはオープンソースのデータレイヤーと高性能な独自のコンピュートソリューションPhotonを組み合わせ、競合他社であるスノーフレイクに対して10倍以上の性能を主張している。
※Databricks Photon:Databricksによって提供される次世代のエンジンであり、Apache Sparkベースのデータ分析と処理のパフォーマンスを大幅に向上させることを目的としている。
しかし、この主張は我々の分析によって裏付けられていない。
スノーフレイクは顧客にデータをそのプラットフォームにロードさせ、そのデータをスノーフレイクの独自形式で保存し、性能、セキュリティ、ガバナンスを最適化している。
しかし、スノーフレイクからデータを移行することは困難で費用がかかり、ベンダーロックインを招く。
それにもかかわらず、スノーフレイクの製品の優秀さと投資利益率(ROI)は多くの顧客にとってロックインのリスクを上回ることが多い。
一方、Delta Lakeの採用は主にDatabricksの顧客基盤に限定されており、Databricksの顧客以外による大規模な導入の証拠は限られている。
Delta LakeはApache Software FoundationではなくLinux Foundationによって管理されており、Databricksがより多くのコントロールを持っている。
※Apache Software Foundation:多くのオープンソースソフトウェアプロジェクトを支援するためのアメリカの非営利法人。
※Linux Foundation:Linuxの開発とオープンソースソフトウェアプロジェクトを支援するために2000年に設立された非営利組織。
Icebergはネットフリックス(NFLX)によって開発され、Apache Software Foundationに寄贈され、広範なエコシステムのサポートを享受している。
Icebergは、特定のコンピュートエンジンに縛られることなく、プラットフォーム全体で均等にサポートされ、多くの高度な機能を実装している。
これにより、アップル(AAPL)やセールスフォース等の主要技術企業によって採用されている。
DatabricksのDelta Lake 2.0のリリースにより、さらに多くの機能が開放され、サードパーティエンジンのサポートが向上したと主張しているが、我々の分析では制限があることが示唆されている。
※サードパーティエンジン:特定のソフトウェアプラットフォームやアプリケーションとは別の外部企業や開発者によって提供されるエンジンやツールのこと。
多くの機能はSpark/Photonに結びついており、サードパーティエンジンのサポートは完全にはネイティブでない。
Icebergは、ユーザーの採用、貢献、バグ修正、機能提案から恩恵を受け、事実上のオープンストレージフォーマットとして成熟している。
しかし、ガバナンスレイヤーやデータカタログにおいては依然として大きな課題が残っている。
※ガバナンスレイヤー:データ管理と利用に関する規制、ポリシー、手続きを定義し、それらを実施するためのシステムやフレームワークのこと。
スノーフレイクがIcebergを正式にサポートする前は、その独自のストレージフォーマットが優れた性能を提供していた。
そして、Icebergは人気を集めていたが、スノーフレイクのフォーマットと比較すると機能が限られていた。
スノーフレイクのコンピュートエンジンとスノーフレイクが管理するIcebergを使用することで、スノーフレイクのコンピュートエンジンと独自のストレージ形式を完全に使用する場合と比べて約80%の性能しか得られなかった。
ただし、性能は劣るものの、完全にスノーフレイクを使用しない選択しよりは優れていた。
スノーフレイクのビジネスモデルは、ストレージ・ビジネスから売上高の11%を計上し、強力なモート(競争優位性)と売上高の可視性を高めていた。
しかし、Icebergが進化するにつれて、業界の観察者はスノーフレイクの将来を疑問視するようになった。
Icebergが完全に同等のオプションになると、ほとんどのユーザーはIcebergに移行すると予想されていた。
そして、この懸念は、IcebergのクリエイターがDatabricksに加わった時に増大した。
これらの懸念にもかかわらず、スノーフレイクがIcebergをサポートするという発表は戦略的な動きである。
これは現在の顧客基盤の100倍以上の市場を開放し、広大な新たな機会を提供する。
スノーフレイクは今やはるかに大きなデータプールに対してそのコンピュートエンジンを提供でき、理論上、ストレージよりも収益性の高いコンピュート需要を増加させる可能性がある。
また、スノーフレイクのストレージレイヤーを開放し、Icebergを完全に受け入れる戦略は、リスクと機会の両方を提供する。
この戦略の成功は、性能とコスト効率の面で競争力を維持し、他のオプションに比べてスノーフレイクが管理するIcebergを顧客に採用させる能力に依存する。
将来の重要な課題には、Icebergエコシステムにおけるスノーフレイクのシェア、Polaris Catalogの採用、そしてスノーフレイクがIcebergエコシステム内で主要なシェアリーダーとして台頭するかどうかが含まれる。
これらの要因が、オープンフォーマットへの同社の戦略的シフトが、同社の市場ポジションと財務パフォーマンスに与える長期的な影響を決定すると見ている。
その他のテクノロジー銘柄関連レポート
1. ① Part 1:クラウドフレア / NET:サイバーセキュリティ銘柄のテクノロジー上の競争優位性(強み)分析と今後の将来性(前編)
2. ①ルーブリック / RBRK(IPO・新規上場):サイバーセキュリティ銘柄の概要&強み分析と今後の株価見通し(Rubrik)
3. パロアルトネットワークス / PANW / 強気:サイバーセキュリティ銘柄のテクノロジー競争優位性分析と将来性 - Part 1
また、私のその他のテクノロジー関連銘柄のレポートに関心がございましたら、是非、こちらのリンクより、私のプロフィールページにアクセスしていただければと思います。