前沿科技,數智經濟
文|白 鴿
編|王一粟
程序員創造的 AI,最先替代的是程序員。
" 大模型的編碼能力,現在已經具備高階程序員(月薪幾萬元)的水平了。" 阿里云云原生應用平臺負責人、通義靈碼負責人丁宇對光錐智能說道。
事實上,AI 代碼工具并不是新生事物,早在上一波人工智能浪潮中就已經開始落地應用。
但此前,"AI 代碼產品原本只是輔助工具,現如今可執行復雜項目、長上下文本編輯,及獨立做簡單代碼任務等。" 商湯科技旗下 AI 代碼產品小浣熊家族的技術負責人張濤對光錐智能說道。
從輔助到獨立寫代碼,AI 代碼已經進化為一個工程級 " 協同 " 編碼工具。
基于此,不僅有越來越多的企業開始通過 AI 代碼工具來實現程序開發的降本增效,2025 年之后,AI 甚至有可能將取代中級程序員。
Meta 創始人扎克伯格日前表示:"2025 年,AI 將達到中級軟件工程師的編程水平。"Meta 將在 2025 年開始實現中級軟件工程師工作自動化,最終會將其應用程序所有編程工作外包給 AI。
這并不是危言聳聽,當前 AI 生成的代碼在企業中的滲透率已經達到了一個驚人的水平。
如谷歌有超過 25% 的新代碼是由人工智能生成;科大訊飛內部 AI 生成代碼采納率已從 2023 年 10 月份的 30%,至 2024 年 6 月份漲到了 52%,單元測試行覆蓋率從 30% 提到 50%。
AI 編碼賽道之所以成為大模型應用最火熱的賽道之一,是因為 "AI Coding(人工智能編程)是大模型應用落地中最高頻剛需、最具確定性的場景,是經過 PMF(產品市場匹配度)驗證的領域。" 丁宇如此對光錐智能說道。
也正因此,越來越多的企業開始布局 AI 編碼賽道,領先的科技公司如微軟、谷歌、AWS、阿里、百度等走在前列。但如此多同類型產品,卻也造成了同質化的競爭,未來該如何成功突圍?如何實現真正的大規模地商業化落地?
從打輔助到協同作戰,
AI 真成了你的程序員同事
2024 年 8 月,美國知名企業 Cloudflare 副總裁 Ricky Robinett 的女兒,一個僅 8 歲小女孩,用時 45 分鐘就開發了一款聊天機器人,引發 180 萬網友在線關注。
她使用的 AI 代碼編輯器 Cursor,也一夜爆火。這也讓 AI 編碼賽道再次成為行業關注的焦點。
在全球范圍內,據 PitchBook 數據顯示,大約有 250 家初創公司推出了 AI 編碼助手。在國內,包括阿里巴巴、百度、騰訊、字節跳動等互聯網大廠,科大訊飛、商湯科技等獨角獸企業,甚至 AI 大模型創業公司智譜 AI 等都紛紛推出相關產品。
AI 代碼產品如雨后春筍般露出,是大模型給 AI 代碼工具能力帶來實質性的進化。
早期 AI 代碼工具主要能夠執行簡單任務,比如根據程序員的注釋,自動補全代碼,在程序員寫代碼過程中,提供代碼錯誤提示等。
隨著大模型能力的升級,AI 代碼工具能夠解決的問題越來越多,比如能夠基于存量工程進行維護升級工作," 已經能夠自主實現某些研發任務了。" 丁宇說道。
比如,大語言模型能夠以自然語言理解人類指令,并根據工程上下文,自動完成復雜編碼任務,包括同時修改前后端多個文件,執行腳本、編寫測試、部署代碼等。
" 最開始通義靈碼是以編碼助手的形態出現,主要是給程序員打輔助,根據代碼上下文,幫助程序員在研發時自動補全代碼。" 丁宇說道,"2024 年年底通義靈碼升級到 2.0 的 AI 程序員形態,成為協同編碼助手,能夠和人類程序員協同工作,感知整個工程,根據場景任務做批量文件修改,實現能力的躍遷。"
而從 AI 代碼工具助手升級為 AI 程序員,前者代碼生成的主力還是人,而后者則逐漸轉向以 AI 為主,人類在其中主要起到監測和確認的作用。
" 此前主要是由人寫代碼,AI 輔助做一些簡單的、可預測性強的、重復性的工作,而現在則可以通過需求描述,讓 AI 來理解和幫助程序員完成一些中等難度的代碼開發工作。" 張濤也如此說道。
另外,隨著多模態大模型、深度推理大模型的進化,AI 代碼工具的能力也在不斷完善。
商湯小浣熊家族的 " 辦公小浣熊 " 產品,除了可以進行基于大模型的數據處理、數據分析和文檔創作外,還能夠支持生成數據圖片和 PPT 文件,這是一個多模態能力輸出的綜合體現。
多模態輸入同樣重要," 很多工具類產品,如果僅通過語言描述來交互,很難準確地實現需求,因為當我們把內容描述成文本時,存在語言表達上的信息損失。同時,大模型當前自身存在的語義理解能力上的欠缺,幻覺問題等,也限制了 AI 代碼工具的能力邊界。直接以圖像或視頻等視覺方式輸入至大模型,則能夠更高效地完成任務。" 張濤說道。
同時,多模態大模型能夠讓 AI 代碼工具實現從文生圖,到生代碼的端到端全棧功能的實現。
以網站設計為例,設計師可以通過文生圖的方式設計出前端視覺稿之后,可以直接給到 Coding 大模型,把視覺稿翻譯成前端界面,再根據前端界面功能大模型自動生成后端代碼。
" 目前,AI 編碼已經可以完成復雜任務,消除知識技能的不對稱,比如從前端到后端可以一體化生成,打破了以前前端、后端人員和能力的分離協作模式,大幅提效。" 丁宇說道," 并且在生成之后,AI 編碼還可以幫助程序員自動生成測試,最終返回測試修改好的結果。"
不過,雖說 AI 已經能夠自主生成一些代碼,但在實際過程中,AI 所生成的代碼并不能夠一次性運行起來,其中也存在著諸多 bug。
一位浙江大學 AI 方向在讀博士生陳榮(化名)對光錐智能表示:" 復雜點的代碼都會有 Bug,基本上很難一遍過,從技術邏輯上來說,可以理解為模型其實把 coding 當作翻譯任務一樣來做,輸出的是一串代碼序列,可能沒考慮好代碼的運行環境等。"
這背后的原因主要有兩方面,一方面是大多數人類很難準確地描述出自己的實際需求,甚至很多資深程序員在寫代碼過程中也是需要反復修改。
另一方面,則在于大模型當前自身理解語義能力上的欠缺,包括存在的幻覺問題,也限制了 AI 代碼工具的能力邊界。因此,雖然 " 在模型上下文窗口允許的范圍,大模型可達到萬行級代碼的理解,但 AI 代碼的能力邊界仍然較難界定。" 張濤如此說道。
就像人類程序員需要反復修改測試代碼一樣,在 AI 生成代碼過程中,也可以通過與其多輪交互,來減少代碼 bug 的存在。
丁宇表示:"AI 編碼并不是一次性生成最終結果,而是跟大模型有多輪交互迭代完成,在跟大模型聯合編碼過程中,有持續思考和推理探索的過程,在多輪交互修改結果正確后,還可以自主進行測試驗證,并對代碼進行部署使用,全生命周期完成任務。"
盡管當前 AI 代碼工具產品仍存在一些問題,但有越來越多的企業開始引入 AI 代碼類工具," 便宜活兒好 " 的 AI 代碼工具不僅提高了程序員的編程效率,也實現了企業的降本增效。
大型項目中的 " 螺絲釘 ",
AI 為程序員提效超 10%
大模型給 AI 代碼工具帶來的進化,讓編程的門檻變得更低。
目前,AI 能夠獨立實現自主編程的場景主要有三類:
一類是小產品,比如個人生活類的 APP 助手;
一類是以內容為主的網站,其代碼量和難度適中,AI 能夠自主實現;
一類是辦公產品,比如 Excel 表格編輯、數據匯總等。
從實際應用來看,這些場景整體的代碼量并不高,且實際開發難度并不大,對于開發者的編程知識要求也不高。
可以說,AI 代碼工具確實降低了編程的門檻,讓更多無代碼能力的人能夠接觸到代碼編程,并可以自主開發一些產品功能。
但是,盡管 AI 代碼工具降低了編程的門檻,卻需要程序員提升自身編程能力的上限,尤其是在更加復雜的軟件開發以及大型企業級系統軟件開發中。
一位金融科技行業的程序員肖肖(化名)對光錐智能表示:" 對于一個公司的工程化項目,還是很難直接全盤交給 AI,工程化項目要求的流程多,也需要多部門協作,而 AI 沒辦法看到全局。"
可以明顯看到,在企業中大模型做的更多地還是臟活累活,全局性及創新的活兒還是需要人類程序員來做。
" 程序員的工作并不僅僅只是生成一個小型項目,其面對的生產代碼,整個項目文件上下文非常復雜,代碼關系也很繁雜,而程序員也對代碼質量有自己的要求。" 張濤說道。
這也就意味著,于企業中的程序員而言,AI 代碼工具更多還是輔助性角色,但也間接地拉高了程序員工作能力的下限,畢竟簡單重復性的工作,AI 基本已經能夠搞定。
" 如果讓 AI 直接生成一家銀行所有業務的 10 萬個代碼文件,它目前肯定是做不到的。" 丁宇坦言," 目前在企業大型項目中,AI 編碼肯定是從小任務開始,找到一個切面,如實現一個功能模塊,或者在一個百萬工程代碼中找安全漏洞,AI 能夠做得非常準確且快速。"
另外,業內皆知,對于大型企業項目來說,最怕存在的問題就是系統的不確定性,如果出現系統 bug,就可能會帶來資源和經濟上的巨額損失。
因此,在丁宇看來:" 大型工程仍需要人類程序員來掌握軟件開發過程中的不確定性,比如架構設計、領域建模等,把已經確定性的內容拆解開來,比如模塊開發、找安全漏洞、補充測試用例等,并交付給 AI,讓其根據人類的指令做這些確定性的工作。"
盡管只是打輔助,AI 代碼工具卻也給開發者和企業帶來了實打實的效率提升。
以阿里云為例,目前所有技術全員都在使用通義靈碼,月活占比超 82%,每天 AI 生成的代碼占總提交代碼量 30% 以上。基于這個數據大致能夠算出來,AI 對開發者提升效率大概是 17.5%,打個折扣也會在 10%-15% 之間。
" 因此,我每次見企業的負責人都會講通義靈碼能夠給工程師團隊提效 10% 以上。" 丁宇說道," 也就是說,如果一家企業有 100 個工程師在使用通義靈碼,就能額外產出 10 個工程師的產能。"
另外,人類程序員都是有細分分類的,比如前端、后端等,如果想要讓一個后端去做前端,那可能就需要給后端工程師做大量的培訓學習,其并不能立馬就接手前端程序員的工作。
但有了 AI 代碼工具后,程序員只需要問問 AI,就可以輕松學習各種語言平臺的研發知識,快速上手。" 以前做一個項目可能花兩三周預研,現在兩三天就能完成任務,讓員工實現 1-N 的能力增長。" 丁宇說道。
當然,對于 AI 來說,還可以幫助人類程序員做更多重復性的工作,比如很多開發者都不愿意寫測試代碼,這些在程序員角度來看屬于沒有創造性的工作,但卻又不得不做。
而 AI 代碼工具可以根據程序員的代碼作為提示詞,自動生成單元測試,真正地解放了開發者,讓開發者把精力花在更具有創造性的工作上。
此外,對于企業來說,除顯性價值提升外,存在的隱性價值在于,AI 代碼工具能夠讓企業更容易保持軟件系統的高質量且長期穩定,其不僅能夠做單元測試的補全,還能夠自主發現安全漏洞并給出修復建議,提升質量的同時,還能縮短項目交付周期。
更為有趣的是,現階段 AI 的編碼能力,借助外部工具使用,已經逐漸趕超中級程序員,商湯小浣熊底層模型特點之一,就是在代碼解釋器能力上做了加強,讓模型能夠實現自主代碼調試迭代。
" 在復雜項目中,單純依靠大模型推理生成代碼,一次性通過率不高,一般不超過 20%。" 張濤說道," 而辦公小浣熊基于代碼解釋器方案,在日常圖表等能力上,代碼通過率已經接近 80%。"
AI 編碼賽道開始分化,
細化場景的創新決定成敗
AI 編碼已經是一個通過 PMF 驗證的落地方向,這也導致眾多玩家切入這一賽道,出現眾多同質化類型的產品。
目前,在中國市場中眾多企業,包括互聯網大廠、中小企業,及大模型創業公司,都紛紛推出了 AI 代碼產品,比如阿里云的通義靈碼、百度的文心快碼、字節跳動的豆包 MarsCode、騰訊云 AI 代碼助手、智譜 AI 的 CodeGeeX 等等。
盡管 AI 代碼產品眾多,但各家在提供的功能能力上差別并不是很大," 目前市場中同質化比較嚴重,功能實際上差不多,畢竟編程產品希望能夠解決用戶的問題是一樣的。" 張濤說道。
不過,隨著大模型技術的迭代升級,AI 編碼賽道也邁入了 " 分化 " 的中期階段。" 從當前 AI 代碼賽道來講,已經開始分化出不同的實現方式。" 張濤說道。
像 Cursor 這樣的產品,能夠基于自己改造的開源 IDE,做完整的任務編程;也有像 Bolt.new 這樣的產品,以線上工具的形式使用,用戶描述需求,AI 完成網頁開發,但它只能實現前端技術棧相關內容等。
現階段可以明顯看到,各個產品已經開始找到不同的細分場景并構建自己的產品優勢,實現差異化發展——有的更擅長做網頁開發,有的則更擅長做已有項目的一些代碼修改任務,還有的可以做一些小工具的開發,或低代碼工作等。
丁宇也認為:" 軟件研發存在非常多場景,有很多細分領域,企業可以從不同的切入點切入,做細分場景的創新或產品形態的創新。"
而各家 AI 代碼工具產品在功能場景上的細分,也會給各家產品帶來商業上的差異,不同企業的商業化側重點也并不完全相同。
比如商湯科技小浣熊家族中辦公小浣熊產品主要聚焦在辦公工具類賽道,在實際的商業化落地中,則是 C 端和 B 端同步進行。
其中 C 端主要以付費訂閱為主,B 端以企業進行私有化部署為主," 目前私有化部署客戶接近 40 家,包含體量比較大的互聯網廠商等。"
不過,張濤同樣看好 C 端賽道的市場潛力,現階段 C 端產品的推廣超預期。
從場景功能,到商業化落地方向,AI 編碼賽道都已經開始出現分化,但這并不是 AI 代碼行業發展的終局形態。
隨著大模型技術能力的持續迭代,下一步 AI 代碼將實現 " 自主編程 ",即不僅僅輔助程序員開發項目,而是能夠自主接受獨立的需求,完成完整的項目任務。
" 未來一定會走向 AI 自主編程,這也意味著將為企業和開發者帶來 10 倍的 IT 生產力提升。" 丁宇說道。
光錐智能"AI 交流群 "已建立,
感興趣的朋友可以添加小助手微信(GZZN2019)溝通進群。
聯系我們
王一粟
創始人 / 主編
ID:cishicike000
※添加時請備注公司 + 姓名 + 來意