7 月 23 日清晨,阿里開源全新的通義千問 AI 編程大模型 Qwen3-Coder,編程能力登頂全球開源模型陣營,并超越 GPT4.1 等閉源模型,比肩全球最強的編程模型 Claude4。
Qwen3-Coder 在代碼占比 70% 的 7.5T 數(shù)據(jù)上預訓練,在后訓練階段進行了編程任務及智能體任務的強化學習,最終實現(xiàn)了通用能力、代碼能力及 Agent 能力的提高:在瀏覽器調(diào)用(WebArena)、工具調(diào)用(BFCL)等 Agent 能力評測中,Qwen3-Coder 刷新開源模型紀錄,超越 GPT4.1;在考察模型自主規(guī)劃解決編程任務的 SWE-Bench 評測中,Qwen3-Coder 取得了開源最佳效果,可媲美 Claude4。
Qwen3-Coder 具備出色的 Agent 能力,尤為擅長解決多步驟的長任務,它能通觀全局自主安排工作內(nèi)容,支持 Agent 調(diào)用各種工具深入鉆研,最終解決復雜編程任務。基于 Qwen3-Coder,網(wǎng)頁開發(fā)、AI 搜索、深度研究等智能體應用將變得更智能、更高效。實測數(shù)據(jù)顯示,在執(zhí)行任務時,Qwen3-Coder 能夠調(diào)用的工具數(shù)量比 Claude 多幾倍,效果非常出色。業(yè)內(nèi)人士指出,開源的 Qwen3-Coder 有望取代昂貴的 Claude,成為 Agent 領(lǐng)域最受歡迎的編程模型。
Qwen3-Coder 能幫助程序員完美完成基礎編程任務,比如寫代碼、補全代碼、修 Bug 等,編程工作效率大幅提升,代碼測試、查詢生成等工作從人工編寫的數(shù)小時驟降至數(shù)分鐘。同時,Qwen3-Coder 也極大降低了普通人入門編程的門檻,讓 AI 氛圍編程(Vibe Coding)真正成為現(xiàn)實,一句話就能生成精妙復雜的 3D 物理模擬過程。
據(jù)了解,Qwen3-Coder 已在魔搭社區(qū)、HuggingFace 等平臺開源,全球開發(fā)者可以免費下載使用。Qwen3-Coder 很快將接入阿里的 AI 編程產(chǎn)品通義靈碼,API 也已上線阿里云百煉。為方便開發(fā)者更好地使用 Qwen3-Coder,通義團隊還開源了一款命令行工具 Qwen Code,此外,Qwen3-Coder 的 API 可以和 Claude Code、Cline 等工具協(xié)同使用。
截至目前,千問系列編程模型全球下載量已突破 2000 萬次,是全球最受歡迎的開源編程模型。據(jù)悉,阿里巴巴內(nèi)部已開始大量使用 AI 編程。一汽集團、中國石油、建設銀行、平安集團、南方航空、小鵬汽車等各行業(yè)頭部企業(yè)也已接入千問 AI 編程模型。(本文首發(fā)于鈦媒體 APP,作者 | 張帥,編輯 | 蓋虹達)