文 | 光錐智能,作者 | 魏琳華,編輯 | 王一粟
大廠正在集火最具 PMF(產品市場契合度)價值的賽道—— AI 編碼。
從 7 月 21 日開始,字節、騰訊、阿里輪番更新 AI 編碼產品和模型:字節已有的 AI 編碼產品 Trae 放出 Solo 版本,加入上下文工程,讓平臺變得更 " 聰明 ";騰訊則把一整套用來部署產品的工具放到其中,做了個 " 全棧工程師 ";阿里更是發布編程大模型 Qwen3-Coder 劍指 Claude 4,直接從模型層下功夫。
在 Cursor 面向中國市場取消了 Anthropic、OpenAI 和 Google 等多家的模型使用后,國內大廠們不僅想做 Cursor 的平替,更是升級開發體驗。它們不再滿足于讓 AI 僅僅充當程序員的 " 副駕駛 ",而是想讓 AI 包攬起 " 產設研 " 一條龍,直接做成品。
和上半年還在讓 AI 當助手、打醬油相比,這一次,AI 編碼已經實現了從輔助程序員生成代碼,到 AI 自主完成生成的飛躍。
AI 編碼 " 三國殺 ",從編碼生成到軟件交付
接連三天的發布中,字節、阿里、騰訊三家大廠先后拿出了能讓 AI 一口氣干完從編碼到成品的工具 / 模型。
這一次的集中更新,AI 開始接管起寫編碼的工作:不僅要寫得質量過關,更是把成品都部署好了。
其中,騰訊和字節對自家編碼產品的更新,重點還是在產品側,畢竟從工程隊到樣板間,中間還隔著很遠,需要靠產品能力補齊。
7 月 21 日,字節宣布更新 Trae Solo 版本,比起聚焦 " 編碼生成 " 的 1.0 階段,新版本跨向了能讓 AI 自主完成 " 軟件交付 " 的 2.0 階段。
在舊的版本中,Trae 在 IDE 界面中編程,其中編程模式有兩種,分別是 Build 模式和 Chat 模式,前者相當于一個傳統編程的 IDE 界面,只需要用戶在右側輸入提示詞,AI 就能自動拆解,按照需求生成大段編碼。相比之下,Chat 模式則更多適用于用戶和 AI 通過聊天的方式,修改編碼、找問題等等,更適用于精細調整上。
在整合后的界面中,Chat 模式和 Build 模式相當于有機整合在了一起。在官方演示中,AI 演示的功能先拆解起了需求,生成一份產品文檔。緊接著,這個文檔就交給 AI 做下一步拆解,根據里面的詳細需求,AI 開始接著寫起了編碼。
可以看到,比起以往只是輔助程序員寫編碼的 AI 助手,新版本的 Trae 們已經能讓零基礎編程的開發者用平臺開發出一個完整的產品。
整合界面、開發工具的基礎上,Trae 還在優化 Agent 功能的 Context(上下文工程)上下手,進一步優化產品功能,克服 " 準確理解需求 " 的問題。
此前,對于 Trae 1.0 版本的評價,程序員們的評論口碑兩極分化:一部分人認為確實能提效,另一部分用戶則集中反映了 AI 回復質量的問題——編碼跑出來了,但長度和可用度都存在一定問題,且來來回 回找不到編碼中存在的 Bug,花費的時間變得更多了。
過往使用這些編碼助手類產品時,用戶往往會遇到一個問題,也就是輸入 Prompt(提示詞)之后,跑出來的編碼和需求 " 兩模兩樣 "。比如,雖然給一個生成女裝電商網站的需求,但這里面還需要大量細節的敲定,比如女裝做哪個年齡段、網站需不需要設置登錄界面等等。
上下文工程想解決的就是這樣一個問題,當用戶再給到一個任務時,它能根據你之前上傳的各種需求文檔、編碼、配置信息等內容抓取和任務需求相關的所有文檔,相當于從龐大的資料庫里精準篩出來了用戶想要的資料。再把這些作為上下文,供 AI 生成的時候參考。在此基礎上,AI 才能跑出來更滿足需求的內容。
無獨有偶,騰訊第二天也更新了自家編碼助手產品 CodeBuddy,這次開啟了一個首次內測 IDE 模式,強調自己 " 首個 AI 全棧工程師 " 的定位。
騰訊把產品優化的重心放在了讓包括產品、設計、研發等不同角色在內的用戶,不管看不看得懂編碼,都能靠 AI 做個產品出來。
在同樣更新 PRD 生成、上線部署等功能的基礎上,CodeBuddy IDE 在一些工具部署的細節處下功夫更多,對看不懂編碼的開發者也更友好。比如支持把設計師用的 Figma 格式設計稿一鍵轉化成網站、接入后端部署工具 SuperBase 等。
當編碼之外的一系列開發工具都被合并到 AI 編碼平臺上,字節和騰訊的編碼助手產品面向的群體也在改變,從程序員,到已經能讓開發者只描述需求就能生成可用編碼,甚至優化到前后端使用。
如果說字節、騰訊的先后更新是在爭奪 " 國內版 Cursor" 的地位,那阿里的本次開源則直接劍指編碼開發工具運行的基座——模型。
目前,無論是 Cursor、字節 Trae 還是騰訊 Codeuddy,海內外 AI 代碼產品都是提供多種模型供用戶選擇調用。比如 Trae 國際版支持 Claude 3.7 和 GPT-4o 等模型,國內版則支持使用 DeepSeek-V3、DeepSeek-R1 和豆包 1.5Pro 等模型,騰訊的 CodeBuddy 則納入了 Claude3.7、Claude 4 的 Sonnet 版本、Gemini 系列和 GPT-4o 等。
平臺把各種模型集成在選擇中,而用戶用得最多的,自然也能靠 API 調用賺到更多的錢。
7 月 23 日凌晨,阿里開源了自研模型 Qwen3-Coder,并發布兩個閉源模型 Qwen3-Coder-Plus、Qwen3-Coder-Plus-2025-07-22 , 在性能對比上直接拉上了目前海外編碼能力最強的模型系列 Claude4。
雖然還是無法和頂配 Opus 性能相比,但和中檔模型 Claude 4 Sonnet 對比,阿里的開源模型已經能夠比肩,甚至在 Terminal-Bench(評估 AI 模型在終端交互任務中性能)、SWE-Bench(評估大模型解決真實軟件工程問題能力)等多個指標測試上超過 Sonnet。在上下文長度方面,Qwen3-Coder 原生支持 256k Token 上下文長度,且能擴展到 1M;相比之下,Claude 4 Sonnet 的上限是 200k。
從性能上,Qwen3-Coder 已經能作為平替使用,從價格來看,阿里也在靠 " 上下文長度區間 " 做定價的區分,試圖把價格打下去。其采用階梯計費模式,最便宜的檔次只要 4 元搞定每百萬 Token 輸入、16 元每百萬 Token 輸出。即使在可以和 Claude 最長輸入長度對標的 128-256k 檔次相比,也達到了每百萬輸入低 50%、每百萬輸出低 60% 以上的價格。
下半年,海內外決戰 AI 編碼
和今年還在初級階段 " 開荒 " 的 Agent 不同,AI 編碼的決戰,將在今年下半年打響。
今年 3 月,OpenAI 首席產品官 Kevin Weil 的判斷擲地有聲,他預計到 2025 年底,AI 編碼將實現 99% 的自動化。Anthropic CEO Dario Amodei 更是大膽預測,3 到 6 個月內,AI 將編寫 90% 的編碼;12 個月內,AI 幾乎接管所有編碼。
結合這幾個月的情況來看,這些看似激進的預測,并非空穴來風。比起還在企業內部磨合的各種 Agent,這一批 AI 編碼產品已經開始在企業內部率先試用。
Anthropic 公司旗下的 Claude Code 便是其中的佼佼者。據 Anthropic 透露,其內部高達 80% 的編碼工作已交由 AI 完成。他們甚至分享了 10 個不同團隊使用 Claude Code 的案例,涵蓋了從編碼生成、調試、重構到測試等多個環節。騰訊這次內測的 CodeBuddy IDE 也在宣傳中注明,內部產品、設計、研發的使用率高達 85%。
這些內部大規模應用的案例,共同傳遞出一個明確的信號——AI 編碼已經跨越了 " 試水 " 階段,開始真正被使用起來,而且是一個明顯能賺到錢的賽道。
Anthropic 開發的 AI 編程工具 Claude Code 在短短 4 個月內就吸引了 11.5 萬開發者用戶,據 Menlo Ventures 風險投資家 Deedy Das 推測,該產品年收入可達 1.3 億美元。字節的 Trae 則在上線的半年內月活超過 100 萬。
沒有布局的大廠,要么試圖自研,要么靠收購加入。OpenAI 試圖以 30 億美元的巨資收購擁有 80 萬用戶的 AI 編程助手初創公司 Windsurf。盡管后來這筆交易告吹,Windsurf 的首席執行官被谷歌截胡,但這本身就足以說明 AI 編碼領域的吸引力,以及巨頭們對搶占賽道可能性的渴望。
在可用性得到極大提升的基礎上,對比海外,國內這波 AI 編碼類軟件的用戶范圍試圖將用戶范圍進一步擴大,不再局限于專業的程序員,而是會進一步擴展到更廣泛的用戶群體。
然而,非程序員之外的開發者真的會是這批產品的受眾嗎?
目前還難以確定。對于沒有基礎的用戶來說,如果出現編碼報錯、不合需求的情況,只靠個人來說,跑一個程序出來容易,但跑個滿意的成品顯然很難。
開源框架 Ruby on Rails 的創建者 David Heinemeier Hansson 在播客中分享," 編輯和修正編碼的能力建立在你是否具備創作能力之上,就像編輯一本書的人通常也要具備寫作能力。"
但可以確定的是,AI 編碼現在能卷的不僅僅是質量的提升,一系列的工具嵌入正在大幅壓縮開發者的時間。
而在 AI 編碼這場即將打響的決戰中,最大的受益者無疑是模型廠商和云廠商。編碼的生成和優化,需要消耗大量的計算資源和模型推理能力,這為背靠自家云設施的大廠們和掌管 API 的模型開發公司帶來了賺錢的機會。
編碼對 Token 的大幅消耗,是一筆利潤豐厚的生意。例如,Anthropic 向投資者透露,Claude Code 目前的年化收入已超過 2 億美元,或每月貢獻超過 1670 萬美元的營收。這充分說明了 AI 編碼在商業上的巨大潛力。
國內廠商也紛紛入局,搶占市場份額。
阿里的做法是底座、產品兩手抓,進一步搶奪話語權。在 " 模型即 Agent" 的今天,阿里發布的自研大模型 Qwen3-Coder 就是證明。一個性能比肩 Claude 4 Sonnet,價格卻對半斬的模型,加上考慮到地緣政治的因素,阿里有希望成為國內編碼產品選擇模型的 " 平替 "。
免費牌,也是騰訊和字節暗戳戳打出來的競爭手段。騰訊本次發布的 CodeBuddy IDE 模式的一個賣點就是支持用戶免費使用 Claude 4 模型,字節的 Trae 則早在國際版中就支持了免費用 Claude3.7。
然而,在模型成本依然昂貴的情況下,限量開放使用是常態,因此通過邀請碼等方式進行裂變,成為大廠們擴大用戶群體的常見策略。
燒錢也要賺吆喝,接下來,誰能真正擔起 " 國內 Cursor" 的稱號?