作者 | ZeR0
編輯 | 漠影
太卷了!太卷了!
智東西 8 月 2 日報道,剛剛,知名 AI 大模型評測 Chatbot Arena 放榜!
阿里
Qwen3-235B-A22B-Instruct-2507 位列大語言模型總榜第三,月之暗面 Kimi-K2-0711-preview、深度求索 DeepSeek-R1-0528 并列為總榜第五,以開源之姿超越 Claude 4、GPT-4.1 等頂尖閉源模型。
在 7 月 30 日公布的 Chatbot Arena 編程榜單中,深度求索 DeepSeek-R1-0528、阿里 Qwen3-Coder 并列第一,月之暗面 Kimi-K2-Instruct 位列第七。
Qwen3-235B-A22B-Instruct-2507、阿里 Qwen3-Coder、月之暗面 Kimi K2 均是在 7 月最新發布的開源模型。
趕在 7 月收尾、8 月開頭,中國 AI 大模型依舊在緊鑼密鼓地上新,字節跳動、階躍星辰、阿里、月之暗面近兩天接連公布模型新動作。
周四晚,字節跳動 Seed 團隊發布發布實驗性擴散語言模型 Seed Diffusion Preview,階躍星辰開源基礎大模型 Step3。周五,阿里開源 " 甜品級 " 編程模型
Qwen3-Coder-30B-A3B-Instruct,月之暗面發布 kimi-k2 的高速版 kimi-k2-turbo-preview。
Hugging Face 還在周五發布了中國 AI 社區 7 月重點,回溯這一個月來令人眼花繚亂的開源浪潮,包括:
另一個 "DeepSeek 時刻 " —— Kimi K2
Qwen 完全矩陣化 - Instruct / Thinking / Coder 模型跨越 30B – 480B 參數規模
多模態浪潮:
GLM-4.1V-Thinking: Image+Text > Text
Intern-S1: Image+Text > Text
Wan 2.2 – Text +Image > video
Skywork-R1V3: Image+Text > Text
Skywork-UniPic: Text > Image / Image > Text
Tar-7B: Any-to-Any
Ming-Lite-Omni-1.5: Any-to-Any
Step3: Image+Text > Text
HunyuanWorld-1: Image > 3D
ThinkSound: Video > Audio
Neta-Lumina: Text > Image
輕量級、可部署的模型
SmallThinker runs on 1GB RAM
Agentic 編程成為主流
Qwen3-Coder: fully spec ’ d tool calling
GLM-4.5: browser agents, IDE assistant
Qwen3 WebDev demo: text-to-frontend code
特定領域和實用的模型 / 工具 / 數據集
Science one S1: Scientific model
Agentar DeepFinance: Finance dataset
ObjectClear: Interactive Vision Tool
Qwen3 MT Demo: Machine Translation Tool
其中回顧的 7 月 31 個亮眼開源模型、1 個框架、1 個數據集,來自 16 家企業、高校或研究機構:阿里(9 個)、月之暗面(2 個)、智譜(2 個)、階躍星辰(1 個)、字節跳動(2 個)、昆侖萬維(2 個)、智源研究院(1 個)、中國電信人工智能研究院(1 個)、螞蟻集團(4 個)、快手(1 個)、捏 Ta(1 個)、中科院磐石(3 個)、上海交通大學(1 個)、騰訊(1 個)、上海人工智能實驗室(1 個)、復旦大學(1 個)。
Qwen3-Coder-30B-A3B-Instruct、Qwen3-Coder-480B-A35B-Instruct,深度思考模型 Qwen3-30B-A3B-Thinking-2507、Qwen3-235B-A22B-Thinking-2507,基礎模型 Qwen3-235B-A22B-Instruct-2507、Qwen3-30B-A3B-Instruct-2507,CoT 音頻模型 ThinkSound,統一視頻生成模型 Wan2.2-TI2V-5B,文生視頻模型 Wan2.2-T2V-A14B。
2、月之暗面(2 個):MoE 基礎模型 Kimi-K2-Base,與 Numina 團隊聯合研發的數學定理證明模型 Kimina-Prover-72B。
3、智譜(2 個):多模態大模型 GLM-4.1V-9B-Thinking,基礎模型 GLM-4.5。
4、階躍星辰(1 個):基礎模型 Step3。
5、字節跳動(2 個):智能體模型 Tar-7B,多語言翻譯模型 Seed-X-Instruct-7B。
6、昆侖萬維(2 個):多模態推理大模型 Skywork-R1V3-38B,多模態統一模型 Skywork-UniPic-1.5B。
7、智源研究院(1 個):文生配音視頻框架 MTVCraft。
8、中國電信人工智能研究院(1 個):
AI-Flow-Ruyi-7B-Preview0704。
9、螞蟻集團(4 個):多模態推理模型 M2-Reasoning,多模態大模型
Ming-Lite-Omni-1.5,金融訓練數據集 Agentar-DeepFinance-100K,交互式深度推理模型
KAG-Thinker-en-ch-7b-instruct。
10、快手(1 個):自適應思考模型 KAT-V1-40B。
11、捏 Ta(1 個):動漫風格圖像生成模型 Neta-Lumina。
12、中科院磐石(3 個):科學基礎大模型 S1-Base-671B、S1-Base-8B、S1-Base-32B。
13、上海交通大學(1 個):端側原生大模型
SmallThinker-4BA0.6B-Instruct。
14、騰訊(1 個):3D 世界生成模型 HunyuanWorld-1。
15、上海人工智能實驗室(1 個):科學多模態大模型 Intern-S1。
16、復旦大學(1 個):語音生成模型 MOSS-TTSD-v0.5。
前兩天 Hugging Face 趨勢榜前十直接被華人團隊包攬。如今最新榜單中,華人團隊占據前十中的 8 席,其中智譜占 2 席、騰訊占 1 席、阿里占 4 席、AI 大神李沐的美國創業公司 BosonAI 占 1 席。
智象未來(HiDream)、美團(MeiGen)、群核科技(SpatialLM)、百度(ERNIE)、稀宇科技(MiniMax)、中科院磐石(ScienceOne)、面壁智能(MiniCPM)等企業的模型雖在最新趨勢榜 100 名開外,但也是中國開源 AI 生態的重要力量。
加起來,積極擁抱 AI 開源的中國企業,超過 20 家。
尤其是阿里,是無人爭鋒的頭號 " 卷王 ",卷得頻率直接斷層,在 7 月先后開源了音頻模型 ThinkSound、多模態推理模型 HumanOmniV2、編程模型 Qwen3-Coder(480B-A35B-Instruct)、推理模型
Qwen3-235B-A22B-Thinking-2507、Qwen3-30B-A3B-Thinking-2507、基礎模型 Qwen3-235B-A22B-Instruct-2507(非思考版)、電影級視頻模型 Wan2.2、編程模型 Qwen3-Coder-Flash(30B-A3B-Instruct),并將新模型背后的 GSPO 新算法公開。
以下是位列最新 Hugging Face 趨勢榜 TOP100 中的中國企業、獨立研究機構及上榜模型:
1、智譜(7 個):GLM-4.5、GLM-4.5-Air、GLM-4.5-FP8、GLM-4.5-Base、GLM-4.5-Air-FP8、GLM-4.1V-9B-Thinking、GLM-4.5-Air-Base。
2、騰訊(3 個):HunyuanWorld-1、Hunyuan3D-2.1、X-Omni-En。
3、阿里(18 個):
Qwen3-30B-A3B-Instruct-2507、Qwen3-Coder-480B-A35B-Instruct、Qwen3-Coder-30B-A3B-Instruct、Qwen3-235B-A22B-Thinking-2507、Wan2.2-TI2V-5B、Wan2.2-T2V-A14B、Qwen3-30B-A3B-Thinking-2507、Wan2.2-I2V-A14B、Qwen3-235B-A22B-Instruct-2507、Wan2.2-TI2V-5B-Diffusers、Owen3-30B-A3B-Instruct-2507-FP8、Wan2.2-T2V-A14B-Diffusers、Wan2.2-I2V-A14B-Diffusers、Qwen3-Coder-480B-A35B-Instruct-FP8、Qwen3-0.6B、Qwen3-235B-A22B-Thinking-2507-FP8、Qwen3-30B-A3B、Qwen3-8B。
4、上海人工智能實驗室(2 個):Intern-S1、Intern-S1-FP8。
5、月之暗面(1 個):Kimi-K2-Instruct。
6、階躍星辰(2 個):Step3、OmniSVG(與復旦大學合作)。
7、捏 Ta(1 個):Neta-Lumina。
8、昆侖萬維(1 個):Skywork-UniPic-1.5B。
9、小紅書(1 個):dots.ocr。
10、字節跳動(1 個):Seed-X-PPO-7B。
11、螞蟻集團(1 個):Ming-Lite-Omni-1.5。
12、深度求索 DeepSeek(2 個):DeepSeek-R1、DeepSeek-R1-0528-Qwen3-8B。
13、快手(1 個):KAT-V1-40B。
14、智源研究院(1 個):bge-m3。
上榜的還有一些知名個人開發者,比如 Kijai,雖然無法確定國籍,但從其密集選用國產模型的動作來看,大概率是華人。
unsloth、Comfy-Org、bullerwins、QuantStack、Phr00t、英偉達等海外團隊位列趨勢榜前 100 的模型,不少用阿里 Qwen3、阿里 Wan2.2、智譜 GLM-4.1V 等模型作為底模進行微調、蒸餾或量化。
最新 Hugging Face 趨勢榜 TOP100:
在展現受歡迎程度的 "Most likes" 榜中,最后一次更新停留在今年 3 月份的舊版 DeepSeek-R1 依舊穩居第一。