不光在于融資與估值高低,還在于 ClickHouse 所在的賽道—— AI 時代的大數據分析和存儲,該領域的客戶需求正日益高漲,同時對數據庫的要求也在全面升級。
ClickHouse 作為一款開源列式數據庫,在處理該類數據時表現出的顯著優勢,不僅力壓同類型的列式數據庫,也讓云數倉獨角獸 Snowflake,以及老牌大廠產品 Redshift、BigQuery 等有了一絲緊張之感。
ClickHouse 脫胎于俄羅斯第一大搜索引擎 Yandex 的開源項目,于 2021 年正式獨立為商業化公司。如今,ClickHouse 發展勢頭正盛,通過向客戶收取云托管費用,其業務在過去一年增長超過 300%,服務企業客戶超過 2000 家,覆蓋金融科技、交通、消費者和醫療保健等多個行業。最近的一些客戶包括 AI 初創公司 Anthropic、特斯拉,以及阿根廷最大電商 Mercado Libre 等。另據外媒可參考消息,ClickHouse 在第一季度末時的年經常性收入已達到 7000 萬美元,年化營收運行率接近 1 億美元。
ClickHouse 越來越成為一家不可忽視的數據庫廠商。不過,對于 ClickHouse 的發展勢頭,首先會存在一個疑問:為什么是此時?以及 ClickHouse 的市場前景如何?
技術即是成本護城河
相對于行存儲的傳統關系型數據庫,列式數據庫意味著數據保存在類似電子表格的行、列中,這種列式架構可顯著加快分析型任務的速度。在數據處理過程中,數據庫系統需要同時從多個存儲區域檢索數據,而數據訪問速度會顯著受到存儲位置的影響——從相鄰區域讀取數據的速度要遠快于從分散區域讀取。
ClickHouse 從設計之初就充分利用了這一特性來優化查詢性能。它將同一列的數據盡可能存儲在相鄰的物理區域,這種存儲布局使得列數據能夠被連續讀取,大幅減少了尋址時間,從而顯著提升掃描效率。這種設計特別適合分析型查詢場景,因為這類查詢通常需要快速訪問大量列數據。
筆者此前與數據庫專家交流獲得一個觀點是,數據驅動的分析應用越來越普遍,要求數據庫技術棧實現統一架構。在此之前,這些技術棧彼此獨立,如 MySQL+Teradata+Elastic Search 等多個系統搭積木的模式,這個架構最大的問題在于過于復雜,需要搭建一個集群來完成數據分析的能力,搭建與維護成本較高。
具體而言,如開源的 MySQL,這類事務型數據庫面向 OLTP 場景設計,社區研發方向側重于加強其事務處理的能力,一般無法擴展以應對處理大量、復雜查詢所需要的分析型任務。傳統數倉針雖內部批量處理密集型用例進行了優化,但并發性有限且性能較慢。而類似于 Elastic Search 的傳統搜索引擎技術,對于非結構化數據分析而言成本高昂,包括存儲和計算資源的占用增加,以及無法實現快速精準檢索等因素,限制了其實際應用范圍。
ClickHouse 提供了一個專門的解決方案來彌補差距——將高性能分析與當今智能數據驅動應用所需的可擴展性和并發性相結合。作為高性能列式存儲,ClickHouse 能夠以極低的延遲在海量數據集上執行交互式分析查詢,非常適合于支持 AI 和機器學習應用,以及實時分析、可觀測性等任務。
蹭上 AI 東風
除了技術架構的創新,ClickHouse 的發展也離不開市場與客戶需求的變化。由于企業不再只是構建 BI 或批量報告,而是希望搭建一個實時的智能數據平臺,并且同時為人類和 AI Agent 所調取。結合當前 AI Agent 的設計思路,由于生成查詢的速度遠超人類,面向其設計的數據平臺 / 數據庫必須具備低延遲響應、支持交互式分析查詢的能力,同時還要有更高的吞吐量,以滿足其高效處理數據的要求。
以近期大熱的 AI 編程為例。盡管多數 AI 編程助手推出時間不長,但開發者留存率依然較高。據研究公司 Indagari 數據顯示,至少 72% 訂閱了編程助手 Cursor 的用戶在六個月后仍繼續付費;超過 20% 的用戶訂閱了多個編程助手,且這一比例還在不斷增長。高留存率反映的是 AI 編程的強粘性,這也意味著企業應用開發速度正借 AI 之勢迎來快速增長。
AI 需要能夠快速釋放數據價值的數據基礎設施,這件事情已變得緊迫。
近期,ClickHouse 分享了 Anthropic 應用其數據庫解決方案的經歷。Anthropic 團隊技術人員給了 ClickHouse 非常高的評價:"ClickHouse 在幫助我們開發和發布 Claude 4 方面發揮了重要作用。" 據其所述,訓練高級模型需要持續了解性能指標和系統行為,ClickHouse 在實時分析數據的速度和靈活性非常高。
Anthropic 在探索智能分析 Agent(agentic analytics)領域,通過引入 ClickHouse 的 MCP 服務器,Anthropic 可以將其模型(例如 AI 編程工具 Claude Code)直接連接到 ClickHouse。這意味著,Agent 可以通過編程方式查詢指標、詢問、檢索答案,而無需編寫傳統的查詢語言。
一些投資人士指出,在 AI 興起、市場對數據庫軟件需求高漲的當下,ClickHouse 可能會與 Snowflake 競爭,比方說 ClickHouse 的實時分析能力會優于 Snowflake。雖然有些客戶想要 Snowflake 提供的 " 花哨功能 ",但 ClickHouse 速度更快,更便宜,且專注于實時分析。
業內將 ClickHouse 與 Snowflake、Redshift、BigQuery 反復拿來對比的一個核心因素,還在于成本。
一些人士認為,ClickHouse 能夠以 25%-40% 的成本提供相同或更優的性能,基本可以取代 Snowflake 和 BigQuery。比如 Snowflake 在計算方面往往相對昂貴,而 BigQuery 的按需查詢模型在處理大量數據掃描時可能會變得昂貴。早在 2023 年,ClickHouse 就曾公開發表言論稱,Snowflake 等云數倉產品在滿足客戶需求和性價比上存在的挑戰。
如今,ClickHouse 同樣將市場目光放到了 Agent 領域。據 ClickHouse 首席執行官 Aaron Katz 的描述,隨著 Agent 在數據驅動型應用、可觀測、數據基礎設施等領域的蓬勃發展,像 ClickHouse 這類面向 Agent 的數據庫需求已經達到一個轉折點。分析的未來不僅僅是報表,而是能夠解讀數據、出發工作流并支持實時決策 Agent。
一些投資人士認為,隨著開發人員轉向 Agent,即 Agent 可以通過客戶瀏覽器或企業應用執行復雜任務,ClickHouse 將迎來更高的需求。
這點也成為風投追捧 ClickHouse 作為下一個 Snowflake 繼任者的關鍵點。畢竟,在數據庫領域,能夠快速發展的初創型軟件公司,不多了。
回顧 ClickHouse 的發展,該公司始于俄羅斯科技巨頭 Yandex 的內部需求。2009 年,為了高效處理 Yandex.Metrica 搜索引擎的海量數據分析任務,Yandex 團隊開始研發一款高性能列式數據庫,這便是 ClickHouse 的雛形。經過多年內部優化,2016 年 Yandex 將其開源,憑借卓越的查詢速度和對大規模數據分析的天然優勢,ClickHouse 迅速在開發者社區走紅,成為 OLAP 領域的明星項目。
隨著開源生態的壯大,ClickHouse 的核心團隊在 2021 年從 Yandex 獨立,并獲得了硅谷風投的青睞。公司成立后,團隊在保持開源版本活力的同時,開始推進商業化,于 2022 年推出 ClickHouse Cloud 托管服務,并完成數輪融資,估值一度飆升至 20 億美元。
在獲得該輪融資后,ClickHouse 步伐明顯加快,除了推動大客戶市場打開,最新任命了在 Atlassian、Slack 等頭部 SaaS 軟件企業的銷售老兵 Kevin Egan 為首席營收官,還同步收購了 HyperDX、PeerDB 等初創公司。(本文首發于鈦媒體 APP,作者 | 楊麗,編輯 | 蓋虹達)