4 月 30 日消息,鈦媒體 AGI 獲悉,清華 90 后創立的北京行云集成電路有限公司(簡稱 " 行云集成電路 ")宣布,推出全新的一體機產品 " 褐蟻 ",僅需最高 15 萬元就可以跑滿血版 DeepSeek R1/V3 大模型,并且對話速度達到了 20token/s。
今天下午,行云集成電路創始人、CEO 季宇對鈦媒體 AGI 表示,目前 " 褐蟻 " 一體機已經支持阿里最新發布的 Qwen3 系列開源大模型,包括頂配版 Qwen3-235B-A22B。
具體來說," 褐蟻 " 一體機有三款不同的配置:最高性價比的 " 超大杯 " 褐蟻 HY90,搭載雙路 AMD EPYC 9355 服務器、24 條 48G 6400M 頻率內存和 NV 5090D 計算卡,支持 FP8、INT4 兩種數據精度,在 FP8 精度下跑滿血版 DS 能達到 21token/s 的對話速度,在 INT4 精度下則能達到 28token/s,最高支持 128K 的上下文,售價 14.9 萬元;此外,行云集成電路還將推出 " 大杯 " 褐蟻 HY70、" 中杯 " 褐蟻 HY50 兩個配置版本。
據悉,行云集成電路成立于 2023 年 8 月,其核心團隊主要來自清華大學及全球頂尖芯片公司,致力于研發下一代針對大模型推理場景的高效能 GPU 芯片,創始人包括季宇,以及公司 CTO 余洪敏。
其中,31 歲的季宇是清華大學物理本科、計算機體系結構方向博士,也是 " 華為天才少年 " 之一,主攻體系結構、AI 芯片方向。而在華為期間,季宇曾是海思昇騰芯片編譯器專家,負責多個昇騰編譯器項目,同時作為研究科學家,展開 AI 編譯器領域和處理器微架構域諸多挑戰性問題攻關;類腦計算機體系結構《自然》論文共同一作,中國計算機學會 CCF 優博獎獲得者。
2024 年 11 月,行云集成電路宣布完成總額數億元的天使輪及天使 + 輪融資,投資方包括智譜 AI、仁愛集團、中科創星、奇績創壇、水木清華校友基金、嘉御資本、春華資本、同創偉業、峰瑞資本等機構。
季宇早前表示,當機器的門檻低到消費級可以接受的成本,邊際成本承擔的商業模型也會發生變化,帶來進一步的產業繁榮。如果計算機體系能支撐消費級可以接受的價格享受極致的 AI 體驗,大模型產業會進一步進入一個類似軟件行業零邊際成本的超高速爆發期。
事實上,目前多家芯片、服務器、云計算、運營商、AI Infra 等領域的公司都發布了 DeepSeek 一體機產品,堪稱 " 百機大戰 ",但其中可以運行滿血版 DeepSeek-V3/R1 模型的企業并不多,目前國產 GPU 芯片層面主要有壁仞科技、摩爾線程等。
據第一財經引述券商數據,預計到 2027 年,國內一體機的市場規模將超過 5000 億元,超過 30 家企業已向市場推出了一體機產品。
一位行業人士早前對鈦媒體 AGI 表示,一體機核心解決的是部署易用性問題。相比復雜的云計算解決方案,項目落地周期更快、私有化安全性更高、價格更有性價比,但 DeepSeek 一體機比較大的問題在于持續維護、升級以及大規模數據調度等,以及一體機綜合使用成本沒有辦法復用。
" 從當年數據庫年代,一體機就興起,這個大家非常喜歡,但不同的一體機,里面的東西差別是非常大的。DeepSeek 出來以后,DeepSeek 一體機爆火,我跟一些領導也聊過,數據中心算力這塊賣得特別好,但都是短期租賃,因為本身硬件固定資產的年限也就 4 到 5 年。所以,我們可以看到一體機比較大的問題是以后持續性的維護、升級以及大規模數據調度等,比如 DeepSeek 一體機是很新鮮,但是大模型演進非常快,現在 DeepSeek 已經不是最領先的了,其他公司也能升上去,而客戶本身可能根本沒有這方面的技術能力。" 上述人士表示,推理一體機只是過渡態產品,最終大模型還是要和云計算進行結合,當整個技術成熟以后,跟多云整合,最后會變成云平臺的一部分。
對此,在季宇看來,現在一體機依然能夠跑得動超大杯的 MoE 模型和 30b 當量的 dense 模型,后續模型迭代其實還好。據悉,相比其他一體機產品,行云集成電路的 " 褐蟻 " 在顯存、KTransformers 等層面有更多的技術研發能力。
據鈦媒體 AGI 了解,下一步,行云集成電路將自研 GPU 卡,持續帶來更低價格,更高 tps 體驗,并且還將實施由 30 臺褐蟻一體機組成的 " 蟻群 " 方案,進一步發揮分布式系統優化能力,或將支持 500-1000 的有效并發數,而價格有望降至 300 萬 -400 萬元——低于英偉達 HGX H200 集群的整體硬件成本。
鈦媒體 AGI 分析認為,從整個商業市場的視角來看,當前國內有很多人都投身于一體機、AI Infra,以及 GPU 服務器等類似算力 " 賣水人 " 工作。隨著推理模型技術迅猛發展,大規模算力投入被質疑,所以國內 AI 算力行業是否將如同 AGI 基座模型市場一般,經歷大浪淘沙后最終僅剩下大廠及頭部的幾家企業,還是說依然會有更多人 " 卷 " 性價比,這一點仍有待進一步觀察。
根據規劃,季宇的最終目標是:為 AI 構建 x86,目標是讓 AI PC 與互聯網底座重回組裝機模式(PC 及服務器),將組裝機打造成 AI 基座,低成本搭建高端大模型,激活 AI 服務器組裝機體系,讓大家能組裝出支撐高端 AI 應用的設備,帶動體系運轉。
(本文首發于鈦媒體 App,作者|林志佳)