周五午后 AI 應用探底回升,鄭中設計漲停,鼎捷數智、果麥文化漲超 15%,此外萬興科技、杰創智能、賽意信息、漢得信息、易點天下等個股同樣漲幅居前。
消息面上,7 月 31 日召開的國務院常務會議審議通過《關于深入實施 " 人工智能 +" 行動的意見》。此外,小米應用商店宣布與字節跳動旗下一站式 AI Agent 開發平臺扣子達成合作,打通智能體一鍵發布能力,進一步拓展 AI 智能體分發服務體系。此次小米應用商店與扣子合作實現平臺系統打通,開發者在扣子開發平臺完成智能體的創建與調試后,可一鍵發布至小米應用商店,無需任何額外操作成本。多個事件催化下,AI 應用方向熱度上升。
而前幾日,財聯社 VIP 特邀行業專家全面解讀 AI 編程等 AI 應用領域發展現狀,7 月 22 日攜手蜂網專家帶來了 "AI 智能體" 主題的【風口專家會議】,相關公司迎來拉升,一起來看。
專家:Kimi K2 的更新程度和萬億參數的水準已經進入了全球大模型競爭的第二梯隊,在國內,它屬于第一梯隊。并且在開源模型領域,參數目前是當之無愧的第一名。
其次,關于 " 專家數從 256 個提升到 384 個 ",這涉及到模型能力的評級定義。OpenAI 曾提出 AGI(通用人工智能)的五個能力等級:L1 聊天、L2 推理、L3 代理(Agent)、L4 創新、L5 組織。要達到 L3 的 " 代理 " 能力,模型必須具備自主調用工具的能力,而不再需要通過傳統的編程方式來開發 Agent。專家數的提升,正代表了模型能夠調用的工具種類和處理問題的顆粒度越來越精細、手段越來越精準。這表明,Kimi 已經開始從 L2 的純推理能力,向 L3 的代理能力進行演進。
再次,關于 " 有效降低了 MLA 中的頭數 ",這與 Transformer 模型的架構有關。通常情況下," 頭數 "(Heads)的增加意味著計算能力的增強。但我們看到,Kimi K2 在計算能力提升的同時,反而降低了頭數,這說明其模型的性價比得到了顯著提升。也就是說,它能用更少的計算資源來捕捉更豐富的信息并提升泛化能力。這背后是技術上的突破,也意味著未來在處理同等長度的上下文(如 128K)時,Kimi K2 所需的硬件成本和算力消耗,將可能遠低于其他同類模型。
問題二:一些券商報告提到 Kimi 在編程方面的表現非常出色,能否介紹一下目前 AI 編程領域在海內外的發展狀況?其使用體量和增速如何?
專家:盡管 Kimi 在編程方面表現出色,在國內已是頂尖水平,優于像 DeepSeek-V2 或通義千問 3.0 等模型,但相較于海外的 Anthropic Claude 3.5 或 Google Gemini 等頂級模型,它仍然處于追趕狀態。
目前,AI 編程領域的發展遇到了一個瓶頸。通過傳統的預訓練方式來提升大模型編程能力的方法,已經達到了天花板,其代碼生成的成功率和完成率大約在 70% 左右。短期內通過預訓練的方式很難再有質的提升。英偉達也發表過相關論文,指出 " 預訓練時代 " 已經結束,現在進入了 " 后訓練時代 "。
因此,Google、Anthropic、Amazon、OpenAI 等國際巨頭,已經不再單純地追求模型能力的提升,而是轉向開發 "Coding Agent" 工具,例如 Google 的 Gemma CLI、OpenAI 的 ChatGPT Context 以及 Anthropic 的 Claude Code 等命令行界面的智能體工具。他們的思路是,從工程學的角度去解決復雜的編程問題,而不是僅僅依賴模型自身的能力。這是行業的一個重要方向轉變。然而,目前國內的大廠或初創公司,尚未看到有類似成熟的商用產品出現。
問題三:在 " 后訓練時代 ",各大模型廠商會如何訓練大模型?現階段提升大模型能力最重要的方式是什么?AI 編程何時會迎來大的突破?國內哪些企業在這方面有較強優勢?
專家:" 預訓練時代 " 的目標是 " 大而全 ",即模型知道的越多,能處理的工作就越多。而 " 后訓練時代 " 的目標則是 " 小而精 "。這意味著,在處理特定領域的專業問題時,99% 的通用訓練數據是無用甚至會產生干擾的 " 信息負擔 ",真正需要的只是那 1% 的專業數據。因此,需要對模型進行分拆,這也是各大廠商都在增加其 MoE 模型中 " 專家 " 數量的原因。
目前,大部分 MoE 模型還停留在 " 單層 MoE" 的結構,即一個 " 路由器 " 將任務分配給不同的專家。但 Google 已經提出了新的訓練方式,即在專家模型下再設置 " 小專家 ",形成類似任務拆解的層級結構,以期返回更精準的結果。但這還處于探索階段。
如果從工程學的角度看,AI 編程的突破很可能在今年下半年或明年第一、二季度出現。
在國內 AI 編程領域,具備較強優勢的是字節跳動(Code-IT 2.0)和阿里巴巴(通義靈碼)。它們在 AI 輔助的 IDE 工具這個賽道上,正在快速追趕海外的先進產品。但在更底層的 AI Coding Agent 領域,國內還處于 Demo 階段,沒有真正發展起來。這主要是因為,海外的編程需求相對簡單,多集中在 Web 端;而中國的需求則以復雜的 APP 開發為主,這使得 AI 編程工具的實現難度更大。
問題四:本次 Kimi K2 開源模型的發布,還可能對哪些下游應用領域帶來較大的推動?
專家:首先,隨著開源模型能力的提升,企業構建私有領域模型的門檻將大大降低。企業可以通過在 MaaS 平臺上部署像 Kimi K2 這樣的高性能開源模型,來快速構建自己內部的、針對特定業務場景的私有模型。
這可能會帶來 "AI 一體機 " 市場的第二個春天。DeepSeek-V2 的發布曾引發了第一波 AI 一體機的高潮,而 Kimi K2 的出現,可能會再次推動這個市場。但這一次的重點,可能不再是銷售新的一體機硬件,而是基于 " 已有的一體機 + 新的高性能模型 " 的應用落地。
問題五:除了 Kimi K2,今年還有哪些模型的進展也很不錯,并已建立了自身的先發優勢?它們各自的優勢體現在哪些方面?
專家:在國內市場,無論是開源還是閉源模型,隨著像 DeepSeek 和 Kimi 這樣的高性能開源模型的出現,已經基本抹平了兩者之間的能力差距。對于企業用戶而言,選擇模型的關鍵不再是開源或閉源,而是自身的硬件能否支持。因此,通用的閉源大模型可能已經沒有太大的發展空間,甚至可能要退出競爭。
未來的機會更多地在于領域模型的開發,即基于高性能開源模型,針對企業內部的稅務、法務、編程等特定知識領域進行微調和優化。企業更傾向于由其內部原有的 BI(商業智能)或數據團隊來承擔這項工作,而不是尋求外部服務商。
此外,在一些非工具類的創意應用領域,可能會迎來一個爆發點。例如,從事文旅項目策劃、創意設計等領域的外包團隊,生產效率正在急劇提升,成本也在急劇下降,這類創意型工作的產出將有大幅增長。
問題六:除了 AI 編程,還有哪些應用場景目前已經在被 AI 大模型大規模地改變?能否舉一些優秀的案例?
專家:有幾個領域值得關注。首先是法務領域。例如,在杭州的一些法院,已經在訴前調解階段引入了 AI 解決方案。通過 AI 的介入,可以幫助消解雙方當事人的主觀情緒,從而有效提升了訴前和解率。
其次是稅務領域。國內一些頭部的 SaaS 稅務服務公司,已經在內部使用 AI 工具來提升銷售能力和解答復雜的稅務問題。因為稅務規則非常復雜,不同地區、不同城市的政策都可能存在差異,AI 可以提供更精準、更定制化的解答。
但需要強調的是,在法務、稅務這類對嚴謹性要求極高的領域,AI 的 " 幻覺 " 問題依然存在,目前它只能起到輔助作用,最終仍需人工進行復核。
相比之下,在創意領域,例如圖片設計、企業宣傳海報制作等,AI 已經被大規模應用。像國內的 " 哩布哩布 " 等平臺,已經形成了圍繞 AI 圖片生成的社區生態,用戶可以對 AI 生成的海報進行二次、三次創作。同時,像浙江美術學院等高校,也開始將 AI 融入其教學內容中。
問題七:在動畫制作和電影制作領域,AI 能否實現大規模的應用和成本降低?
專家:在影視和游戲制作的 " 概念設計 " 階段,AI 已經可以發揮很大的作用。例如,編劇和導演可以使用 AI 來快速生成故事板、場景概念圖等。
但在后期的商業化制作環節,AI 的應用還很有限。以游戲制作為例,雖然有很多 AI 工具出現,但主流的游戲引擎,如 Unity 和 Unreal Engine,其整個工具生態和工作流都是圍繞 " 人 " 來設計的,開放給 AI 的接口和支持還非常不足。因此,目前 AI 在這些領域的應用,更多還停留在輔助人進行信息檢索的層面,而無法真正深度融入生產流程。
問題八:英偉達 CEO 黃仁勛一直強調 " 物理 AI" 的重要性,能否介紹一下什么是物理 AI?國內是否有企業在這方面已有建樹?
專家:物理 AI,簡單來說,就是讓 AI 具備物理世界的感知和交互能力,例如光感、觸感等。它與 " 具身智能 " 的概念密切相關。如果說大模型是機器人的 " 大腦 ",那么物理 AI 就是機器人的 " 手和腳 "。
其核心技術是構建 " 物理模型 " 或 " 事件模型 ",這本質上是一種更高級的多模態能力。過去的多模態,主要是將圖像、視頻等數據向量化后,讓模型能夠處理。而物理 AI 則需要解決如何將物理世界的各種感知信息進行泛化的數據化處理。
目前,物理 AI 在應用上存在一個天然的壁壘,就是 " 時間 " 或 " 延遲 "。在傳統的硬編碼編程模式下,機器人執行動作的響應時間是以毫秒計算的。但當需要大模型對復雜的物理感知數據進行處理和決策時,其反饋時間可能是以分鐘來計算的。這就是為什么看一些具身智能的演示時,會感覺動作很別扭、一卡一頓的原因——大模型的反饋速度太慢了。因此,如何用更低的成本,實現對物理世界信息的瞬時處理和反饋,是物理 AI 面臨的核心挑戰。
在國內,目前在人形機器人等具身智能系統上,還沒有看到成熟的物理 AI 應用。但在一些特定領域,已經有一些探索。例如,在無人機領域,開始嘗試用大模型替代傳統的 CNN/RNN 網絡來進行障礙物識別。還有一個例子是,一家中國的公司在海外做的除草機器人,會先利用大模型對整個草坪進行掃描,識別出石頭、土壤、雜草等,進行路徑規劃,然后再執行除草任務。也就是說,目前大模型的應用更多還是在 " 離線規劃 " 層面,而較少用于 " 實時交互 "。
問題九:在 AI 領域,接下來有哪些值得關注的事件預期?對 OpenAI 的 GPT-5 有怎樣的期待?
專家:GPT5 的發布。對它的期待,主要是看它能否實現從 L2(推理)到 L3(代理)能力的跨越。此外,也很期待它在多模態能力,特別是物理感知能力上,是否會有新的突破。根據一些行業消息,GPT5 的內部代號為 "2025-07-13",這意味著其訓練數據的截止日期是今年 7 月 13 日,理論上應該很快就會發布。遲遲未發布,可能正是在攻克這些關鍵的技術難題。它的發布,無疑將為整個行業指明新的發展方向。
問題十:數據標注業務近兩年是否會有新的動能?
專家:在 " 后訓練時代 ",數據標注,或者更準確地說," 數據服務 ",其重要性反而會凸顯。因為 AI 自身還無法有效地篩選和標注數據。未來的核心需求,不再是標注海量的公開數據,而是幫助企業標注其內部的私有數據。例如,稅務 SaaS 公司就面臨著如何標注企業內部的財務和法務數據的巨大痛點。為企業提供高質量的私有數據標注和處理服務,將是一個巨大的需求點。