英偉達(dá) CEO 黃仁勛到訪中國(guó),所過之處都是焦點(diǎn),以至于有些原本的重點(diǎn) " 失焦 " 了。
7 月 14 日,英偉達(dá)宣布將恢復(fù) H20 在中國(guó)的銷售,并宣布推出面向中國(guó)市場(chǎng)的全新且完全兼容的 GPU。H20 攫取了絕大多數(shù)的關(guān)注,因其直接與大模型訓(xùn)推相關(guān),且此前被美國(guó)市場(chǎng)封禁。
相比之下,黃仁勛推出了一款全新且完全兼容的 NVIDIA RTX PRO GPU,并宣稱該產(chǎn)品 " 是為智能工廠和物流打造數(shù)字孿生 AI 的理想選擇 ", RTX PRO 是專業(yè)領(lǐng)域產(chǎn)品,用戶群相對(duì)小眾,因此沒有得到應(yīng)有的關(guān)注。
但在業(yè)內(nèi)人士看來(lái),其重要性被大大低估了,畢竟值得黃仁勛都親自帶貨。據(jù)市場(chǎng)消息,該產(chǎn)品可能命名為 RTX PRO 6000 D Blackwell,將于今年三季度啟動(dòng)供應(yīng),到年底的出貨量目標(biāo)是 100~200 萬(wàn)片,對(duì)應(yīng)價(jià)值約為數(shù)十億到上百億美元,比英偉達(dá)此前因 H20 被禁導(dǎo)致的 45 億美元資產(chǎn)減值還要多。
這款被 H20 遮住的 RTX Pro,將如何影響市場(chǎng)?
聚焦數(shù)字孿生需求,卡位藍(lán)海市場(chǎng)
黃仁勛在接受媒體采訪時(shí)表示,本周是第三屆國(guó)際供應(yīng)鏈博覽會(huì)的開幕,供應(yīng)鏈涵蓋了機(jī)器人、智能工廠等復(fù)雜系統(tǒng)。我們推出 RTX Pro 正是為這些數(shù)字工廠、數(shù)字雙胞胎、機(jī)器人等應(yīng)用場(chǎng)景量身打造的。RTX Pro 非常適合教機(jī)器人如何成為 " 機(jī)器人 ",教智能工廠如何提高效率和質(zhì)量。因此,本周的博覽會(huì)是一個(gè)非常合適的時(shí)機(jī)來(lái)宣布這一產(chǎn)品。
他還提到,新的產(chǎn)品 RTX Pro 專為數(shù)字孿生應(yīng)用設(shè)計(jì)。數(shù)字孿生構(gòu)建的是一個(gè)虛擬世界,一個(gè)數(shù)字機(jī)器人。之所以需要數(shù)字機(jī)器人,是因?yàn)橐ㄟ^在數(shù)字世界中訓(xùn)練,教會(huì)實(shí)體機(jī)器人如何出色完成任務(wù)。RTX Pro 最初是為運(yùn)行名為 Omniverse 的全新應(yīng)用平臺(tái)所打造,該平臺(tái)對(duì)數(shù)字工廠、智能工廠及機(jī)器人等領(lǐng)域至關(guān)重要。因此 RTX Pro 是獨(dú)一無(wú)二的創(chuàng)新產(chǎn)品,堪稱全球首創(chuàng)。
正如黃仁勛所言,中國(guó)有廣闊且完備的制造業(yè),市場(chǎng)前景足夠誘人,這是英偉達(dá)推出 RTX Pro 的直接原因。
據(jù) IDC 預(yù)測(cè),2027 年中國(guó)數(shù)字孿生市場(chǎng)規(guī)模將突破 1200 億元,年復(fù)合增長(zhǎng)率達(dá) 45%。其中,工業(yè)制造(汽車、電子、新能源)占比超 60%,僅汽車行業(yè)就有超 200 家工廠計(jì)劃部署英偉達(dá) Omniverse 數(shù)字孿生系統(tǒng),單廠投入從 500 萬(wàn)到 2000 萬(wàn)不等。
51WORLD AI 平臺(tái)技術(shù)總監(jiān)王憶源對(duì)筆者表示,中國(guó)制造業(yè)正加速向 " 智能工廠 " 升級(jí),數(shù)字孿生成為核心工具,RTX PRO 特性正好匹配中國(guó)制造業(yè)升級(jí)中的數(shù)字孿生 AI 需求,工業(yè)制造(如汽車、航空)、建筑設(shè)計(jì)(BIM)、影視渲染等領(lǐng)域?qū)Ω咝阅?GPU 的依賴日益增強(qiáng),尤其在 AI 與 3D 可視化融合的背景下,RTX PRO 系列持續(xù)獲得穩(wěn)定采購(gòu)需求。
在 AI 應(yīng)用方面,包括 AI 推理、小模型訓(xùn)練、視頻生成、數(shù)字人、AIGC 等業(yè)務(wù),企業(yè)對(duì)具備通用計(jì)算能力的顯卡配置關(guān)注度顯著上升,RTX PRO 系列恰好滿足這些多樣化、復(fù)合型的算力需求。
" 當(dāng)然,作為算力消耗者,我們也比較關(guān)注它的價(jià)格,更準(zhǔn)確的說(shuō)是性價(jià)比。在獲得面向中國(guó)市場(chǎng)的全新 RTX PRO 顯卡后,會(huì)馬上做一手評(píng)測(cè),合適的話就可以展開部署,試試這款芯片到底能不能打。"
" 我們非常關(guān)注這款芯片的落地時(shí)間。" 王憶源表示," 比如實(shí)時(shí)渲染能力,支持構(gòu)建高精度工廠虛擬模型(如生產(chǎn)線、倉(cāng)儲(chǔ)系統(tǒng)),需強(qiáng)大圖形算力;輕量 AI 推理:優(yōu)化能耗、預(yù)測(cè)設(shè)備故障等場(chǎng)景無(wú)需頂級(jí)訓(xùn)練芯片,RTX PRO 的 GDDR7 顯存(帶寬 1.1TB/s)與定制化 AI 核心正適配此需求。"
閹割版全功能 GPU,但依然是優(yōu)選
英偉達(dá)在今年 3 月的 GTC 2025 大會(huì)上,推出了專為工作站和服務(wù)器設(shè)計(jì)的 RTX PRO 系列 Blackwell 專業(yè)顯卡,但此前該產(chǎn)品同樣不被允許出口到中國(guó)市場(chǎng),第三方價(jià)格在 8 萬(wàn)元左右。
一位算力產(chǎn)業(yè)鏈人士表示,原計(jì)劃采購(gòu)高性能算力卡如 H100 的用戶正加速向 NVIDIA RTX 系列轉(zhuǎn)向,進(jìn)一步推動(dòng) RTX PRO 在專業(yè)市場(chǎng)的接受度和采購(gòu)意愿。
新一代 RTX PRO 具備 NVIDIA 流式多處理器、第四代 RT 核心、第五代 Tensor 核心、更大、更快的 GDDR7 顯存、第九代 NVIDIA NVENC、第六代 NVIDIA NVDEC、第五代 PCIe、DisplayPort 2.1 等特性,適合于需要處理大量數(shù)據(jù)、進(jìn)行高強(qiáng)度計(jì)算的專業(yè)領(lǐng)域。
黃仁勛也提到,新的 RTX 架構(gòu)基于 Blackwell,而之前的 RTX 架構(gòu)基于 Hopper。實(shí)際上,我們稱它為 Beta Hopper。這款新 GPU 不同于 H20,它有計(jì)算圖形和光線追蹤(Ray tracing)功能。光線追蹤對(duì)于傳感器模擬非常重要,比如激光雷達(dá)、雷達(dá)和計(jì)算機(jī)圖形學(xué)。我們可以模擬數(shù)字工廠中的傳感器,或者自動(dòng)駕駛汽車中的傳感器,或者機(jī)器人身上的傳感器。
"RTX Pro 具備 H20 和其他 AI 產(chǎn)品所不具備的能力,它是一款同時(shí)具備計(jì)算圖形和 AI 功能的產(chǎn)品,專為數(shù)字雙胞胎設(shè)計(jì)。在應(yīng)用中,我們有名為 Omniverse 的 AI 庫(kù),所有操作都在 Omniverse 上運(yùn)行。" 他說(shuō)。
RTX Pro 是一款全功能 GPU,既能支持圖形也能支持 AI,而 H20 只適合 AI 計(jì)算,但是為了規(guī)避美國(guó)制裁風(fēng)向,RTX PRO 通過剝離高帶寬內(nèi)存(HBM)、移除 NVLink 互聯(lián)技術(shù)等敏感模塊,嚴(yán)格符合美國(guó)出口限制,確保長(zhǎng)期對(duì)華供應(yīng)合法性。
圖形渲染需求 :構(gòu)建高保真、物理真實(shí)的三維仿真場(chǎng)景,需要芯片支持強(qiáng)大的實(shí)時(shí)光線追蹤能力、高分辨率紋理處理能力和復(fù)雜的幾何渲染能力。
AI 計(jì)算需求:產(chǎn)品核心為驅(qū)動(dòng)空間智能大模型進(jìn)行理解、分析、決策和交互,從而需要芯片具有支持海量的并行計(jì)算能力。
大容量顯存需求:三維仿真場(chǎng)景本身就是顯存消耗大戶,高分辨率的紋理、復(fù)雜的模型幾何數(shù)據(jù)(數(shù)百萬(wàn)甚至上億個(gè)多邊形)、環(huán)境光遮蔽貼圖等都需要占用大量顯存。大模型更是顯存的吞噬者:語(yǔ)言大模型和視覺大模型的參數(shù)量動(dòng)輒幾百億,模型本身就需要占用至少數(shù)十 GB 的顯存才能運(yùn)行。
從 RTX PRO 的性能來(lái)看,RTX Cores ( 光線追蹤核心 ) 專為實(shí)時(shí)光線追蹤設(shè)計(jì),Tensor Cores ( 張量核心能以極高的效率執(zhí)行大模型的訓(xùn)練和推理任務(wù),CUDA Cores ( 統(tǒng)一計(jì)算核心 ) 提供強(qiáng)大的通用并行計(jì)算能力,可以同時(shí)處理圖形渲染管線中的其他任務(wù)(如物理模擬、后處理)和 AI 計(jì)算中的輔助任務(wù)。
此外,RTX PRO 系列顯卡提供了遠(yuǎn)超消費(fèi)級(jí)顯卡(如 GeForce 系列)的大容量顯存。用戶可以在同一時(shí)間,將復(fù)雜的、城市級(jí)別的三維場(chǎng)景和參數(shù)量巨大的數(shù)字孿生 AI 模型同時(shí)加載到一塊 GPU 顯存中。
這避免了因?yàn)轱@存不足而頻繁在系統(tǒng)內(nèi)存和顯存之間交換數(shù)據(jù),從而保證了交互的流暢性和實(shí)時(shí)性。沒有大顯存,要么只能用簡(jiǎn)化的場(chǎng)景,要么只能用小模型,數(shù)字孿生 AI 平臺(tái)發(fā)揮將大打折扣。
競(jìng)爭(zhēng)對(duì)手不及預(yù)期,英偉達(dá)生態(tài)延續(xù)強(qiáng)勢(shì)
黃仁勛透露,中國(guó)已有數(shù)百個(gè)數(shù)字孿生項(xiàng)目基于 Omniverse 開發(fā),覆蓋汽車工廠、光伏電站等場(chǎng)景。
RTX PRO 作為硬件入口,可深度綁定用戶至英偉達(dá)生態(tài)。此外,中國(guó) 150 萬(wàn) CUDA 開發(fā)者中,大量人員已熟悉英偉達(dá)工具鏈。RTX PRO 支持 CUDA 并行計(jì)算,能夠降低工業(yè) AI 應(yīng)用開發(fā)門檻,延續(xù)開發(fā)生態(tài)黏性。
王憶源認(rèn)為,RTX Pro 跟其他芯片一樣,更大的粘性在于軟件生態(tài),包括 CUDA 以及基于 CUDA 的各種深度學(xué)習(xí)庫(kù),Omniverse 協(xié)作與仿真平臺(tái),以及基于 Omniverse 的 IsaacSim 具身智能仿真平臺(tái)。
51WORLD 推出了專門面向智能輔助駕駛和機(jī)器人的仿真平臺(tái) SimOne, 可以作為國(guó)內(nèi)的替代品,不過底層也是基于 D3D/Vulkan 圖形 API 和 CUDA,使用的也是 NVIDIA 的顯卡。
對(duì)于開發(fā)者和企業(yè)來(lái)說(shuō),選擇 RTX PRO 意味著極低的學(xué)習(xí)成本和遷移成本,以及廣泛的軟件兼容性和很高的性能確定性。選擇競(jìng)爭(zhēng)對(duì)手則可能意味著需要投入大量精力去解決軟件兼容性問題、性能優(yōu)化問題,甚至重寫部分代碼,這在商業(yè)應(yīng)用中是難以接受的。
他還表示,從競(jìng)品的性能看,偏圖形學(xué)的顯卡 ( 如 AMD Radeon PRO ) : 在傳統(tǒng)的 CAD 設(shè)計(jì)、視頻剪輯、三維建模等領(lǐng)域表現(xiàn)出色。但當(dāng)用戶需要進(jìn)行 AI 模型訓(xùn)練、AI 功能開發(fā)(如 AI 輔助渲染:深度學(xué)習(xí)超采樣、AI 降噪,生成式內(nèi)容創(chuàng)作:在圖形軟件中直接調(diào)用 AI 模型,生成紋理、3D 模型、環(huán)境背景等)時(shí),其 AI 生態(tài)和硬件性能(缺少成熟的張量核心)就顯得力不從心,導(dǎo)致效率較低或功能無(wú)法實(shí)現(xiàn)。
偏 AI 的計(jì)算卡 ( 如一些純 AI 加速卡,或 NVIDIA 自家的 A100/H100 等 ) : 擁有頂級(jí)的 AI 訓(xùn)練和推理性能,但在圖形輸出和實(shí)時(shí)渲染方面能力為零或極弱。它們無(wú)法直接用于高保真的可視化交互。
對(duì)于既有圖形渲染能力,又有 AI 訓(xùn)練和推理性能的 RTX PRO 來(lái)說(shuō),能為數(shù)字孿生 AI 提供一個(gè) " 單卡解決方案 "。用戶可以在同一臺(tái)工作站、同一個(gè)軟件環(huán)境中,無(wú)縫地完成從數(shù)據(jù)可視化、AI 模型訓(xùn)練 / 微調(diào),到最終交互式渲染的全流程。這帶來(lái)的總體擁有成本和工作流效率的優(yōu)勢(shì)是巨大的。
在數(shù)字孿生領(lǐng)域,國(guó)產(chǎn) AI 芯片的存在感不足,重視程度需進(jìn)一步提高。只有全功能的 GPU 才能滿足數(shù)字孿生領(lǐng)域的需求,也淘汰了不少國(guó)產(chǎn)芯片玩家。
但國(guó)產(chǎn)芯片也在逐漸發(fā)力,例如摩爾線程,其全功能 GPU 芯片采用自主研發(fā)的 MUSA 架構(gòu),實(shí)現(xiàn)了單芯片架構(gòu)同時(shí)支持 AI 計(jì)算加速、圖形渲染、物理仿真和科學(xué)計(jì)算、超高清視頻編解碼的技術(shù)突破。其 s 專業(yè)圖形加速產(chǎn)品,主要應(yīng)用于工業(yè)設(shè)計(jì)、高清視頻編輯、數(shù)字孿生、AI 云電腦等場(chǎng)景。
一位制造行業(yè)高管表示,相較于大模型訓(xùn)推領(lǐng)域,國(guó)產(chǎn)芯片都看到并且投入了大量資源,國(guó)產(chǎn)芯片在數(shù)字孿生領(lǐng)域的存在感較低,RTX PRO 轉(zhuǎn)向工業(yè)可視化與輕量 AI 推理,避開國(guó)產(chǎn)芯片優(yōu)勢(shì)領(lǐng)域,選擇數(shù)字孿生這一有待開發(fā)的藍(lán)海市場(chǎng),也是英偉達(dá)有意為之的戰(zhàn)略選擇。
就目前來(lái)看,英偉達(dá)的產(chǎn)品短期內(nèi)具有不可替代性,它能夠最大程度的發(fā)揮軟件產(chǎn)品在圖形渲染上的性能和質(zhì)量,以及支撐多并發(fā)多模態(tài)的數(shù)據(jù)融合驅(qū)動(dòng)的任務(wù)。
但他也表示,在產(chǎn)品交付和部署的過程中,相關(guān)政策鼓勵(lì)和支持國(guó)產(chǎn)化硬件的替代,部分企業(yè)更希望以國(guó)產(chǎn)化的顯卡、芯片等產(chǎn)品實(shí)現(xiàn)數(shù)字孿生,但就實(shí)際測(cè)試效果來(lái)看,仍然存在一定性能和質(zhì)量上的差異。此次 RTX Pro 的 " 特供版 " 有望能很好地平衡這個(gè)需求。(本文首發(fā)于鈦媒體 APP,作者 | 張帥,編輯 | 蓋虹達(dá))
9 月 11 日 -14 日由鈦媒體集團(tuán)、ITValue 聯(lián)合主辦的 2025 ITValue Summit 數(shù)字價(jià)值年會(huì)將以「AI 落地場(chǎng)景真相」為主題,與新老朋友重聚三亞,并在全年圍繞 1 場(chǎng)年度演講,5 大 ToB 明星 IP 持續(xù)內(nèi)容 " 造血 ",設(shè)計(jì) N 個(gè)場(chǎng)景的想象空間,打造 1 本《AI 落地場(chǎng)景指南》,一同尋找 AI 實(shí)際落地應(yīng)用難題背后的 "10 大真相 ",探索數(shù)字經(jīng)濟(jì)時(shí)代的變革和機(jī)遇。(點(diǎn)擊進(jìn)入了解更多大會(huì)報(bào)名信息)
同期,2025 年度「創(chuàng)新場(chǎng)景 TOP 50」榜單評(píng)選征集啟動(dòng),可掃碼提交案例。
備注說(shuō)明:場(chǎng)景案例對(duì)應(yīng)的產(chǎn)品或服務(wù)需已實(shí)際落地,并具有創(chuàng)新性和示范性。