2 月 13 日,文心一言在官網宣布將于 4 月 1 日 0 時起全面免費,所有 PC 端和 App 端用戶均可體驗文心系列最新模型,以及超長文檔處理、專業檢索增強、高級 AI 繪畫、多語種對話等功能。
同一時間,OpenAI 首席執行官 Sam Altman 也公布了 GPT-4.5 和 GPT-5 的最新消息。免費版 ChatGPT 能在標準智能設置下無限制地使用 GPT-5 進行對話。
消息一出,不少網友下場直呼:AI 普惠的時代來臨了!
先是扔給大模型一個提示詞:請參照原文:" 日照香爐生紫煙,遙看瀑布掛前川。" 在新的主題上進行仿寫:昆明湖仿寫要求:模仿風格及格式,寫兩句詩。
文心一言 3.5 給的結果雖然工工整整,但僅有一句話,并沒有看到思考過程。
文心一言 3.5 的回答中規中矩,并沒有給出明確的答案,字里行間透露著一種 " 朦朧感 "。
同一個提示詞:" 幫我畫一個奧黛麗赫本吃湯圓。" 文心一言 3.5 給出了一張看起來 "AI 味 " 滿滿的圖。
經過實測,可以直觀的看出文心一言 4.0 版本相較于之前的 3.5 版本,已經發生了質的飛躍。這個版本不僅在語言理解和多模態能力上大幅提升,還新增了深度搜索等超強功能。
4.0 版本的文心一言,對專業咨詢類問題的解決能力進行全面加強,可以輕松應對專業問題查詢門檻高、查詢渠道專精、查詢結果分析難度大等使用挑戰。同時在民生、創業、經濟分析等方面問題,也能夠提供專家級的內容回復。
除此之外,4.0 版本還具備了更全面的思考、規劃、反思能力,針對工具規劃及調用能力上進行了全面加強,能夠更加 " 聰明 " 的使用多個工具解決各類復雜任務問題。例如先搜索內容,再配合代碼解釋器;或者閱讀上傳文檔、再搜索分析,最后綜合給出結果。
提升了用戶體驗的同時,也進一步降低了人們在使用 AI 方面的門檻。
諸多衡量標準中,RAG 作為大模型競爭的核心能力之一,是衡量大模型優劣的重要維度。而百度在 RAG 的技術上具備中文深度理解、多模態檢索、垂直領域定制化以及實時數據整合能力等優勢,在中文互聯網、企業服務、政務等場景中具十足的實用性和競爭力。
并且從 RAG 能力實測來看,國內外主流大模型中,百度文心一言綜合表現最為亮眼。
但雷峰網回顧一下 AI 搜索相關的技術發展,其實本質上都是對 RAG 技術的延伸,在不斷的迭代中,文字層面的 RAG 技術已經基本讓大模型消除了 " 幻覺 ",但在多模態方面,尤其是圖像生成,RAG 技術的運用還遠遠不夠了。
網上經常可以看到各種大模型的文生圖功能產出的失敗案例,不僅一眼假,還往往背離物理邏輯,出現各種張冠李戴的 " 幻覺問題 ",充滿的 "AI 味 "。
而百度早就意識到了這一點,在去年就自研了一種專門解決圖像生成幻覺問題的 iRAG 技術,早早地就走在了行業的最前面。
而 iRAG 讓生成的圖片沒有 "AI 味 " 的同時,也可以幫助用戶大大降低創作成本。總的來看,百度這波全面放開文心一言的操作,真就是把最好的內容拿給用戶了。
技術進步與成本降低的雙重驅動
毫無疑問,百度宣布文心一言全面開放,是背后技術突破與成本降低的結果。
最近李彥宏在 " 世界政府峰會 " 上就表示:" 在過去,當我們談論摩爾定律時,每 18 個月,性能水平或價格都會減半。但是今天,當我們談論大型語言模型時,增加的成本基本上降低了,可以在 12 個月內降低 90% 以上。"
在訓練成本方面,百度通過昆侖芯的高性價比,減少了計算資源的需求,從而降低了算力成本。同時,百度智能云的萬卡集群(計劃擴展至 3 萬卡)利用規模效應,提高了資源的利用率,避免算力閑置,提升了計算效率。
百舸平臺則通過高性能網絡和創新散熱方案,優化了大規模集群的部署和管理,提升了通信效率,降低了能耗。
為了解決大模型訓練時對高通信帶寬的需求,百度建設了超大規模 HPN 高性能網絡,通過優化的擁塞控制算法和集合通信策略,提升了通信效率,將帶寬有效性提升至 90% 以上。同時,由于萬卡集群能耗高,百舸采用了創新的散熱方案,有效降低了能耗,從而減少了電力成本。
為了提升 GPU 的有效利用率,百舸還不斷優化分布式訓練策略,通過高效并行化任務切分將訓練主流開源模型的集群 GPU 有效利用率(MFU)提升至 58%。百舸還提供了全面的故障診斷手段,通過百度自研的 BCCL(百度集合通信庫)快速定位和修復故障,保障訓練任務的穩定性,將故障恢復時間從小時級縮短到分鐘級,確保集群的有效訓練率達到 98%。
除此之外,有分析人士猜測,文心一言全面開放的一個關鍵原因是推理成本的持續降低。
他們指出,百度在模型推理部署方面具有明顯優勢,特別是在飛槳深度學習框架的支持下,飛槳的并行推理和量化推理等自研技術大大提升了推理性能,并有效降低了推理成本。飛槳與文心的深度優化協同作用,使得推理的效率得到了進一步提高,同時降低了相關成本。
短短 2 月 13 日一天之內,OpenAI、百度兩家 AI 大廠同時宣布全面開放自家大模型產品。
北京時間 2 月 7 日,OpenAI 宣布 ChatGPT Search 向所有人開放,無需注冊,來到 OpenAI 官網首頁就可以直接使用搜索功能。幾小時之后,谷歌也宣布向所有人開放最新 Gemini 2.0 模型,包括 Flash、Pro Experimental 和 Flash-Lite 三個版本。
頭部大廠的各種操作,隱約中讓人們慢慢看清了大模型行業未來的發展趨勢:全面開放。
AI 技術的開放不僅能夠降低技術的門檻,也可以讓越來越多的用戶和開發者能夠直接接觸到這些強大的模型和工具。同時,開放也意味著 AI 將更廣泛地滲透到各行各業,影響日常生活和工作模式。
或許隨著越來越多的企業加入到開放大模型的行列,AI 的應用場景將變得更加多元化,技術門檻會逐步降低,甚至可能形成一個更加開放和共享的 AI 生態。
而這場由百度、OpenAI 等頭部大廠引領的 AI 大模型開放浪潮,雷峰網看到也許僅僅是未來更大規模開放的開始,但在這個過程中,不僅是 AI 技術的推進,更是 AI 向人類社會的深度融合,進而帶來的更廣泛的創新機會與發展空間。
AI 普惠的時代,真的來臨了。