作者 | 劉寶丹
編輯 | 周智宇
經過兩年多的發展后,AI 開始加速進入 Agent 時代。
從移動互聯網時代的 App 王者,到云計算市場的追趕者,字節正押注 AI Agent 這一新范式,發起一場豪賭式的換道超車。
"PC 時代主體是 Web,移動時代是 APP,AI 時代則是 Agent。" 火山引擎總裁譚待認為,技術主體經歷了三個時代變化,AI 時代會推動開發范式與技術架構全面升級。
6 月 11 日,火山引擎在 Force 原動力大會上接連拋出重磅炸彈,豆包大模型 1.6 系列正式發布,綜合成本降低 63%。同時,AI 云原生服務全面升級,支持企業構建生產級 Agent。
字節跳動 CEO 梁汝波罕見為火山引擎站臺,他表示,字節致力成為優秀的創新科技公司,會堅定長期投入,追求智能突破,服務產業應用。
字節 AI 錨定 Agent 落地,開啟了新一輪搶位賽。
字節必須再贏一次
字節對即將到來的 AI 時代做了堅決的投入,這背后是一種強烈的生存危機感。
AI Agent 的崛起正在重構互聯網入口格局,傳統的 App 交互模式面臨顛覆性挑戰。當用戶可以通過自然語言指令讓 Agent 自主完成復雜任務時,那些曾經風光無限的超級 App 可能面臨被邊緣化的風險。
中金公司認為,AI Agent 這類產品形態的創新與底層的模型演進同樣重要,并展現出了強大的商業化變現和落地潛力。展望未來,AI Agent 或將通過接管手機的方式,重塑互聯網生態。
作為 APP 超級工廠,字節通過推薦算法打造了今日頭條和抖音等內容平臺,做的是流量生意。但 AI 技術有望顛覆原有的注意力模式,孕育出新的 AI 超級入口。
字節要想繼續稱霸 AI 時代,必須抓住新一輪 AI 技術革命,重新迭代自己。
路徑也很明確,字節、阿里、百度等科技大廠均采取了 AI 大模型 + 云計算 + 應用側的全棧 AI 布局戰略。對擅長產品的字節來說,應用端和模型端已于去年底躋身第一梯隊,火山引擎也呈現翻倍式增長。
根據 IDC 發布的《中國公有云大模型服務市場格局分析,1Q25》,按照大模型調用量的市場份額來看,火山引擎占據 46.4% 的市場份額,其次是百度智能云、阿里云。不過,這只是大模型調用量,縱觀整個云計算市場,火山引擎還未進入第一梯隊。
Agent 無疑是火山引擎彎道超車的最大機會。
" 如果我們把時間拉長,把技術棧展開。我們實際正處于 PC 到移動到 AI 三個時代的變化之中。" 譚待表示,在這三個時代里,技術主體在發生變化,PC 時代的主體是 web,移動時代是 APP,AI 時代是 Agent,它能夠自主地感知,規劃和反思,完成復雜任務。
更重要的是,Agent 對云計算的需求將快速上漲。譚待表示,"Agent 而言,它的 Token 消耗量很大,AI 大模型最早的應用就是聊天,一個人跟模型聊一個小時,就是 20 多萬的 Token,但如果讓 Agent 做一個任務,它要處理特別復雜的事情,一個任務可能就是 20 萬 Token。"
譚待判斷," 如果說 24 年是中國大模型應用的元年,那 25 年將很可能是中國 Agent 落地的元年,Agent 將逐步進入企業的各個業務流程。"
IDC 認為,從大模型模態的角度,當前調用量仍然以大語言模型、文本類的能力為主,自 2024 年第四季度,語音類模型調用量也開始增長。該機構預計,到 2025 年,圖像、視頻類大模型的調用量也將開始起量。
對字節來說,Agent 是一場必須拿下的戰役,只有此戰勝利了,才有機會繼續走向 AGI。
先鋪路,再跑車
目前來看,決定 Agent 落地的前提主要有兩個層面,一是 AI 大模型的智能程度和調用價格,二是與 Agent 配套的 AI 基建。
從 AI 大模型來看,強推理、多模態、低成本是支撐 Agent 大規模應用的基礎。會上,火山引擎正式發布豆包大模型 1.6 系列,包括 Doubao-Seed-1.6、Doubao-Seed-1.6-thinking 和 Doubao-Seed-1.6-flash,Doubao-Seed-1.6 是 all-in-one 的綜合模型,支持深度思考、多模態理解等多項能力,thinking 和 flash 分別是深度思考強化版和極速版。
"Doubao-Seed-1.6 是國內首個支持 256K 上下文的思考模型,這對于復雜 Agent 的構建來說非常重要。" 譚待表示,Agent 做復雜任務時,特別是處理圖像和 GUI 操作或者 Coding,窗口很容易就超過 128K,提升到 256K 非常重要。
從測評結果來看,豆包 1.6-thinking 模型有明顯提升。在 GPQA Diamond 測評集上取得了 81.5 分,在 AIME25,獲得了 86.3 分。MultiChallenge 上,得分 48 分。在多個權威測評集上,得分均屬于國際第一梯隊。
繼 3 月阿里千問 QwQ-32B 將成本降到 DeepSeek R1 的 1/10," 價格屠夫 " 字節也繼續發力。
據譚待介紹,絕大部分企業的消耗量集中在 0-32K 范圍,豆包 1.6 的價格是每百萬 tokens 輸入 0.8 元,輸出 8 元。" 這是一個非常高性價比的價格,豆包 1.6 成本下降了 63%,企業只需要原來三分之一左右價格,就能獲得新模型。"
字節還發布了最新的豆包視頻生成模型 Seedance 1.0 pro。根據第三方權威榜單 Artificial Analysis 最新結果,豆包視頻生成模型在文生視頻、圖生視頻兩個維度都超越了諸多主流模型,登頂全球競技場第一。
Seedance 1.0 pro 的價格是每千 tokens1 分 5 厘,相當于每生成一條 5 秒的 1080P 視頻只需 3.67 元。譚待表示,假如有 1 萬塊錢預算,制作超過 5 秒 1080P 高清視頻共計 2700 條,價格遠低于可靈 V2.0 大師版和 Veo2 等主流視頻生成產品。
語音正在成為 AI 應用和 Agent 的核心交互方式,會上,字節還宣布,豆包 · 實時語音模型正式全量上線開發平臺方舟,對企業客戶開放使用。
在 AI 基建方面,火山引擎正在構建一個全面的、能滿足未來 Agent 各種交互需求的技術底座 。
會上,火山引擎發布了 MCP 服務、PromptPilot 智能提示工具、AI 知識管理系統、veRL 強化學習框架等產品,并推出多模態數據湖、AICC 私密計算、大模型應用防火墻,以及一系列 AI Infra 套件。
這些產品背后是技術范式的改變。譚待表示,從 Web、Apps 再到 Agents,核心主體已經改變,以前的架構本質上是為程序員設計,現在 Agents 很多集成步驟是通過模型策略展開的,模型跟工具、環境交互,需要更好的模型和 Agent 平臺。
基礎架構也一樣,譚待表示,數據以前是 For BI ( 商業智能 ) ,現在 For AI。這次,火山引擎發了兩個安全產品,用來解決大模型防火墻、模型投毒被攻擊,以及通過端加密解決安全隱私的問題。
在譚待看來,云原生興起于移動互聯網時代,它具備彈性擴縮容、容器化、DevOps、微服務等特點,AI 云原生是為全新的 AI 主體去設計,需要更強的模型,更好的 Prompt Pilot,以及處理更原始多模態數據的數據湖。
開發范式上,字節跳動技術副總裁洪定坤認為,隨著模型能力的持續進步,AI 有機會成為調度者,通過調用不同的 Agent 和工具,讓軟件開發 "all in one",更大幅度地降低開發門檻,提升開發效率。
從基礎設施到開發范式,從數據到安全,火山引擎 AI 云原生全棧服務升級。譚待希望,用一套完整的 AI 云原生能力幫助企業做好 Agent 落地。
火山,沖撞舊秩序
在 AI 技術的驅動下,國內公有云市場時隔三年迎來復蘇。
IDC 數據顯示,2024 下半年,中國公有云(IaaS 基礎設施 /PaaS 平臺軟件 /SaaS 應用軟件)市場增速 17.7%,創近兩年的高點。這是移動互聯網轉向 AI 時代的一個積極信號。
多年來,國內云市場格局保持穩定狀態,包括阿里云、華為云、騰訊云、百度智能云在內的科技大廠和以中國移動旗下的移動云、中國聯通旗下的聯通云等為代表的電信運營商是云市場的核心主力。
如今,字節的全方位進擊正在引發產業格局的深度重構,火山引擎有望成為云計算市場復蘇的最大受益者。
據字節內部人士透露,去年 12 月,豆包大模型的日均 tokens 調用量是 4 萬億。今年 3 月份,豆包大模型的日均調用數是 12.7 萬億,而截至今年 5 月底,這個數字已經超過了 16.4 萬億,仍然保持著高速增長。
北京星漢未來創始人、CEO 劉道儒對華爾街見聞表示,在 Agent 落地方向,字節、阿里等大廠更適合提供配套工具、外部 API,以及通過云平臺支持企業部署智能體平臺。" 智能體開發的配套工具、外部 API 等種類繁多,且很瑣碎,適合由大廠提供服務。"
廣發證券互聯網傳媒首席分析師曠實對華爾街見聞表示,火山引擎在 AI 大模型調用量上領先,離不開字節的底層能力,包括推薦算法中臺、數據中心、軟硬件基礎架構的統一,踐行 AI 云原生的火山引擎以 GPU 為核心優化計算、存儲與網絡架構,降低延遲。
曠實進一步表示,火山引擎通過算法、工程、庫存和供應鏈的管理等實現大幅降價的同時保持毛利,此外,豆包大模型廣泛應用于 30 多個外部行業,可以幫火山引擎實現客戶突破。
一位業內人士對華爾街見聞表示,火山引擎很擅長打價格戰,而且內部組織效率遠高于其他大廠,這種以小搏大的做法成效顯著,去年 5 月,豆包大模型率先降價,將大模型價格帶入 " 厘時代 ",阿里、騰訊等只能被動跟隨。
對于這次降價,譚待表示,技術、軟件、硬件都在不斷進步,肯定能持續優化成本。" 我們宗旨是做到了一定程度之后,就盡最大可能把技術紅利釋放出來,最重要的是,把紅利釋放出來之后能讓業界所有的開發者和企業都受到實惠,AI 應用也會發展更快。"
截至目前,對于火山引擎的降價,其他廠商并未有明顯的降價動作。百度內部人士表示,暫時沒聽說相關消息。
賭局才剛剛開啟
2017 年,字節首次嘗試 to B 業務,給手機廠商的內置瀏覽器輸出推薦算法和內容,并由此組建了火山引擎,它的角色是字節內部的技術中臺。2020 年,火山引擎正式對外,并逐漸瞄準云計算市場。
入場比同行晚了近 10 年,字節進軍云計算市場的決心來自對市場的判斷,公司認為,云計算賽道很大,尤其國內云計算滲透率比國外低。2021 年,譚待定下了一個為期十年的千億收入目標。
to B 業務是一個需要時間積累的慢生意,字節入局初期的壓力可想而知,但幸運的是,字節趕上了 AI 時代。
譚待對華爾街見聞表示," 過去兩年多,字節自研的豆包大模型和火山引擎的 AI 云原生基礎設施,已經收獲了不少市場的認可。" 據內部人士透露,火山引擎 2024 年的增速是三位數,收入規模超百億,今年的目標是實現翻倍。
火山引擎是字節押注 AI 時代確定性最強的底牌,字節看重的是收取 AI 時代 " 水電費 " 的生意。正如去年底昆侖萬維創始人周亞輝所說,字節會學習谷歌和亞馬遜,一邊吃廠商廣告費用,一邊吃 IT 費用。" 火山引擎云的市場份額會等于字節的廣告市場份額,不僅僅是中國,還包括全球。"
不過,距離千億規模還有很遠的距離,字節要想盡可能多的搶占 AI 市場份額,還面臨諸多挑戰和不確定性。
首先,AI 技術仍處于全球競賽當中,火山引擎模型調用量主要來自豆包,豆包大模型家族必須持續迭代,保持在第一梯隊,才能和火山引擎形成更好的協同效應。同時,大模型在推理和多模態方面的性能,也將影響 Agent 落地速度。
" 基礎設施成本和擴展性是 Agent 落地面臨的巨大瓶頸。" 一位 Agent 領域的創業者對華爾街見聞表示,現有云服務難以兼容短時高并發與長時大規模需求,多平臺嚴格的身份驗證迫使用戶頻繁介入,制約了 Agent 自主性和跨場景協同能力。
AI 正從 " 模型軍備競賽 " 轉向 " 實用價值落地 ",Agent 的核心競爭力將不再僅僅是底層模型的 " 智商 " 高低,而是其融入實際場景、解決具體問題、形成商業閉環的能力,這需要強大的平臺生態和豐富的應用支撐。
字節 B 端基因相對較弱,尤其是相對于阿里這樣采取開源技術棧的大廠來說,需要時間構建生態。華爾街見聞獲悉,火山引擎發起了 V-START 加速器計劃,扶持 AI、具身智能、跨境出海等初創企業。
私有化部署也是一個關注點。劉道儒認為,Coze 屬于國內智能體開發平臺的佼佼者,不過受制于無法私有化部署,Agent 落地時沒有歷史數據或一兩個人的早期 AI 創業團隊會更多選擇 Coze,而有歷史數據或小有規模的創業團隊一般會選擇 Dify 等開源、可私有化部署的智能體開發平臺。
字節還面臨較強的競爭壓力。AI 是不能錯過的時代機遇,阿里、騰訊、百度等大廠等也在全面布局,而且憑借各自基因建立起競爭優勢,智譜 AI、階躍星辰、Manus 等創業公司具有較強的創新活力。
值得一提的是,字節在過去兩年吸納了非常多的 AI 人才,他們的穩定性也是外界關注的焦點。今年 3 月,字節跳動 AI 大將駱怡轉戰 AI 創業公司。近日,字節 Seed 核心主力李成剛傳出調崗消息。對此,字節未予置評。
在 AI 大模型的首場戰役里,字節大力出奇跡,逆襲進入第一梯隊。接下來,AI 之戰核心在于技術迭代能力和產品創新能力,這是一場全方位的生態之戰,比拼的是科技公司對現實世界的顛覆能力。
坐上牌桌的字節開始新一輪押注了。