網易首頁 > 網易號 > 正文申請入駐

中國開源云原生 Kafka 走向全球：AutoMQ 突破 10K GitHub Star

2026-06-22 16:22:21　來源: 開源中國

廣東舉報

分享至

2026 年 6 月，AutoMQ 開源倉庫突破 10K GitHub Star。寫下這句話的時候，我們很開心，也很感謝一路關注、試用、提 issue、給反饋的開發者和用戶。

基礎軟件的 Star 通常來得慢一些。開發者點下 Star 之前，往往已經讀過架構、跑過 demo、翻過 issue；企業團隊愿意把它放進 Kafka 選型，也會先評估兼容性、可靠性、遷移成本和長期運維。AutoMQ 的 10K Star 里，有這樣的耐心和真實反饋。根據 OSSInsight 的 GitHub 關注來源統計，約 74% 的關注來自海外；同時，AutoMQ 已經進入中國、東南亞、歐洲和美國企業的生產環境。這個結果讓我們很受鼓舞。

AutoMQ 開源時，我們想推動的是 Kafka 在云時代的存儲架構演進。Kafka 已經沉淀了成熟的協議、語義和生態，這些能力應該繼續保留；持久數據長期綁在 Broker 本地磁盤上，會把數據中心時代的彈性、成本和運維壓力帶到云上。AutoMQ 選擇 Diskless Kafka，把流數據存儲放到對象存儲和共享存儲之上，讓 Broker 成為無狀態計算節點，同時保留 Kafka 成熟的協議、語義和生態。AutoMQ 也是圍繞這條路線最早開源并持續投入生產實踐的 Diskless Kafka 項目之一。

從 10K Star 往回看，AutoMQ 的增長曲線背后有開發者的工程追問、社區里的架構討論、客戶生產環境里的驗證，也有一支中國開源基礎軟件團隊走向全球市場的過程。沿著這些經歷往下看，就能看到越來越多 Kafka 工程師和平臺團隊開始關注 Diskless Kafka 的原因。

Diskless Kafka 開拓者亮相

AutoMQ 第一次被大量海外開發者看見，是在 Hacker News。2024 年 4 月，AutoMQ 以Show HN: AutoMQ - A Cost-Effective Kafka Distro That Can Autoscale in Seconds發布，并一度登上 Hacker News 榜首。

這次討論讓我們第一次真切感受到，海外開發者對 Diskless Kafka 這個方向有很強的興趣。評論區集中在標準 Kafka 客戶端兼容、寫入確認、WAL 故障恢復、benchmark 數據等問題上。這些都是真實 Kafka 生產使用里繞不開的問題。那一次，HN 帶來了流量，也帶來了很具體的工程反饋。

HN 之后，AutoMQ 也持續把 Diskless Kafka 的工程實踐帶回 Apache Kafka 社區。我們希望分享過去幾年圍繞共享存儲、云原生彈性和 Kafka 兼容性形成的架構思考。

2025 年，AutoMQ 提出 KIP-1183: Unified Shared Storage。這個提案進入 Apache Kafka 社區后，很快形成了一輪關于共享存儲架構的討論，多位 Apache Kafka Committer / PMC 成員參與其中。討論聚焦在 shared-storage 是否應該進入 Kafka、Stream 抽象如何設計，以及它與 ISR 和本地存儲引擎如何長期共存。

這個 KIP 討論的是 Kafka 如何面向對象存儲、文件存儲、塊存儲等共享存儲服務，抽象出統一的共享存儲層。它延續了 AutoMQ 一直推動的方向，讓 Kafka 保留成熟的協議和生態，同時讓存儲層更好地利用云基礎設施已經提供的持久性、彈性容量和按需付費模型。

到 2025 年 Confluent Current London，這些線上討論變成了面對面的技術交流。Current 是 Kafka 生態里重要的行業會議之一，現場聚集了很多長期使用和建設 Kafka 的工程團隊。我們帶到倫敦的，是 AutoMQ 的開源實現、KIP-1183、海外客戶的生產實踐，以及過去幾年圍繞 Diskless Kafka 做出的工程選擇。

在現場，我們和 IBM、Apple、OpenAI 等多個 Kafka 技術團隊交流了 AutoMQ 低延遲 Diskless Kafka 的架構設計。大家直接討論幾個工程問題：持久數據為什么可以從 Broker 本地盤遷移到共享存儲，Kafka 客戶端和周邊生態如何保持兼容，Broker 故障恢復和擴縮容時怎樣減少數據搬遷。在這樣的技術交流里，AutoMQ 的 Diskless Kafka 路線和低延遲共享存儲實現收到了很積極的反饋。我們也看到，全球一線企業的 Kafka 團隊同樣在探索下一代 Kafka 存儲架構，評估如何從 Broker 本地盤走向 Diskless / shared-storage 形態。在云上和 AI 應用帶來的實時數據需求下，本地盤、多副本復制和大規模數據搬遷，已經成為很多團隊繞不開的負擔。

AutoMQ 的 Diskless Kafka 路線

AutoMQ 的技術創新之所以得到這么多開發者關注和認可，原因很直接：Apache Kafka 以 Broker 本地磁盤為中心的傳統架構，已經越來越難滿足云和 AI 時代對成本、彈性和實時數據處理的要求。

Kafka 的協議、語義和生態仍然很成熟，需要重新設計的是存儲模型。HN 評論、KIP-1183 和倫敦現場交流反復回到同一個問題：Kafka 要繼續適配云上和 AI 時代的實時數據需求，Broker 是否還應該和持久數據綁定在一起？

傳統 Kafka 的 shared-nothing 架構在數據中心時代非常合理：每臺 Broker 管理自己的本地磁盤，Partition 數據通過 ISR 在多個 Broker 間復制，系統用應用層副本來獲得可靠性。那個時代，機器之間復制數據通常不會單獨出現在云賬單里，存儲和計算綁定在同一臺物理機上，也是一種簡單直接的工程選擇。

到了云上，這套前提變了。云基礎設施已經把持久性、跨可用區冗余和彈性容量做成了標準服務，但傳統 Kafka 仍然按數據中心時代的方式運行。結果是，團隊在云上同時承擔了幾類重復成本：

?存儲層面，云盤已經提供持久性，傳統 Kafka 仍然會把同一份 Partition 數據復制到多個 Broker。用戶要準備多份云盤容量，也要為副本寫入付出成本。

?網絡層面，Broker 之間跨可用區復制 Partition 數據，會形成持續的跨 AZ 流量成本。

?運維層面，擴縮容除了增減計算節點，還要搬遷大量 Partition 數據，重平衡過程可能持續數小時。

?資源層面，計算、存儲和網絡被綁在 Broker 上，團隊很難只為某一類資源獨立擴容。

AutoMQ 的 Diskless 架構把持久數據放到共享存儲，讓 Broker 成為無狀態計算節點，同時保留 Kafka 的協議、語義和生態。Broker 故障替換或擴縮容時，系統主要切換元數據和流量歸屬，不再為每一次容量變化搬遷大量 Partition 數據。

對企業用戶來說，架構升級不能讓業務代碼和上下游生態重來。AutoMQ 基于 Apache Kafka 代碼庫，在接入層保留 Kafka 的協議語義和客戶端生態，在存儲層用 S3Stream 和共享對象存儲替代傳統本地 LogSegment。客戶端、Connect、Flink、Schema Registry 和運維習慣都可以延續。

下面這張圖比較了 Apache Kafka 和 AutoMQ 在架構上的差異。

持續技術創新與全球化

Diskless Kafka 能不能成立，最終要看生產環境。AutoMQ 最早的一批高強度反饋來自國內客戶。

在國內推進 AutoMQ，更像本土作戰。相比海外市場，國內客戶給了我們更早的初始信任，也愿意更早把關鍵 Kafka 負載交給 AutoMQ；國內互聯網業務的數據規模、鏈路復雜度和高峰流量，又讓產品很快面對真實生產壓力。穩定性、Kafka 兼容性、遷移工具、擴縮容過程、故障定位和運維診斷，這些能力都在一線場景里被反復打磨。

2024 年，得物可觀測平臺大面積投產 AutoMQ。2025 年，京東、騰訊在多條業務線使用 AutoMQ，吉利汽車等企業也在生產場景中采用 AutoMQ。2026 年，愛奇藝也開始在業務場景中采用 AutoMQ。這幾年的國內落地，把 AutoMQ 放進了不同類型的高強度場景，也打磨了內核、遷移和運維能力。京東、騰訊、吉利汽車這樣的中國企業服務著大規模用戶和復雜業務，它們的生產驗證，讓海外客戶理解 AutoMQ 時多了一層可參照的工程背景。

進入海外市場后，信任要重新建立。對一家中國背景的基礎軟件公司來說，海外客戶的評估會更謹慎：團隊是否理解 Kafka，架構設計能否解釋清楚，代碼能否通過客戶自己的測試，生產問題出現后能否定位和修復。AutoMQ 采用 Apache 2.0 License 開源，讓用戶可以直接讀代碼、跑測試、看實現細節，也能沿著 issue、PR 和公開設計理解系統為什么這樣工作。

開源之外，我們也持續把技術細節講出來。AutoMQ 定期在國內外分享分區秒級遷移如何實現，基于對象存儲的流存儲引擎如何工作，為什么可以做到 100% Kafka 兼容，以及 Diskless Kafka 和共享存儲架構在云上的取舍。這些分享讓海外開發者看到 AutoMQ 的工程方法和技術判斷，看到這個新架構名字背后的具體實現。代碼、文章、演講、社區討論和生產驗證疊在一起，才讓一個陌生項目進入工程團隊的選型和架構評估。

帶著這些積累，AutoMQ 開始從國內走向東南亞和歐美。新加坡國民級出行應用 Grab、美國 CRM 領導者 HubSpot、英國美容健康領導者 Fresha、德國音樂流媒體巨頭 SoundCloud、瑞士全球物流領導者 Kuehne + Nagel，都在各自的 Kafka 生產場景里采用了 AutoMQ。這些客戶分布在不同地區和行業，面對的數據鏈路也不一樣。AutoMQ 走到這些場景里，靠的是開源透明、Kafka 兼容性、Diskless 架構帶來的彈性和成本優勢，也靠國內大規模生產場景積累下來的工程能力。

Fresha 是其中一個公開留下工程記錄的例子，也讓我們能直接聽到終端客戶自己的聲音。它是英國美容、健康與自我護理行業的 SaaS 平臺，數據平臺需要把大量 PostgreSQL CDC 事件寫入 Kafka，再由 Snowpipe、Flink、StarRocks 等系統消費。它的技術負責人 Anton Borisov 發布過兩篇公開文章，記錄團隊的遷移過程，也寫下了他對 AutoMQ 開源透明和持續創新的評價：

With AutoMQ, we can trace how the system works, why certain choices were made, and where it can improve.

That transparency: messy, evolving, but real is what keeps progress visible.

That’s why I have a soft spot for AutoMQ as they don’t just build the future, they open it up for everyone to build together, yet continuing pushing the frontier with new ideas and features.

— Anton Borisov, Fresha

工程團隊可以沿著代碼、設計和公開討論理解 AutoMQ，追蹤系統如何工作，判斷架構選擇為什么這樣做，也能看到后續還可以在哪里繼續改進。對基礎軟件來說，這種透明性會直接影響工程團隊是否愿意繼續評估、遷移和長期使用。

最終，AutoMQ 能進入 Grab、HubSpot、Fresha、SoundCloud、Kuehne + Nagel 等海外生產環境，靠的是幾件事一起發揮作用。開源帶來的透明性、持續技術分享建立的理解和信任、國內大規模生產場景提供的驗證，以及 Diskless Kafka 架構本身帶來的成本、彈性和運維價值，放在一起，才讓海外客戶愿意把 AutoMQ 放進真實 Kafka 鏈路。

展望未來

謝謝每一位 Star 過 AutoMQ、試用過 AutoMQ、提過 issue、貢獻過代碼、給過反饋的開發者。也謝謝那些愿意把 AutoMQ 放進真實生產環境的客戶。

10K Star 是個節點。我們會慶祝它，也會很快回到日常工作里：繼續寫代碼、修 issue、打磨文檔、服務客戶、和社區討論 Kafka 在云上的下一步。

接下來，AutoMQ 會繼續保持 Kafka 兼容和開源透明，繼續打磨低延遲 Diskless Kafka 架構，讓更多企業可以在云上運行關鍵 Kafka 負載時，少一點本地磁盤和數據搬遷帶來的負擔。面向實時分析、數據湖和 AI 應用帶來的新需求，我們也會繼續推進 Table Topic 等能力，讓 Kafka 數據更直接地進入下一代數據基礎設施。

回到那條 Star History 曲線，里面的每一個拐點，背后都有開發者的嘗試、客戶的驗證、伙伴的轉介紹和社區的討論。下一段曲線，希望和更多開發者、用戶和生態伙伴一起寫下去。

如果你也在評估 Kafka 的云原生化、成本優化或彈性擴縮容，可以從 AutoMQ 開源倉庫開始，直接閱讀代碼、運行測試環境，驗證 Diskless Kafka 是否適合你的生產工作負載：在 GitHub 上查看 AutoMQ。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.