日本一区二区三区久久-日本一区二区三区久久精品-日本一区二区三区日本免费-日本一区二区三区在线观看视频-国产不卡免费视频-国产不卡视频

IT之家 10分鐘前

小米開源“ Xiaomi MiMo ”大模型：以 7B 參數超越 OpenAI o1-mini

IT 之家 4 月 30 日消息，小米大模型團隊通過 "Xiaomi MiMo" 公眾號宣布，今天，小米開源首個 " 為推理而生 " 的大模型 Xiaomi MiMo，聯動預訓練到后訓練，全面提升推理能力。據介紹，MiMo 是來自全新成立不久的 " 小米大模型 Core 團隊 " 的初步嘗試。

在數學推理（AIME 24-25）和代碼競賽（LiveCodeBench v5）公開測評集上，MiMo 僅用 7B 的參數規模，超越了 OpenAI 的閉源推理模型 o1-mini 和阿里 Qwen 更大規模的開源推理模型 QwQ-32B-Preview。

官方表示，MiMo 推理能力的提升，由預訓練和后訓練階段中數據和算法等多層面的創新聯合驅動，包括：

預訓練：核心是讓模型見過更多推理模式

數據：著重挖掘富推理語料，并合成約 200B tokens 推理數據。

訓練：進行了三階段訓練，逐步提升訓練難度，總訓練 25T tokens。

后訓練：核心是高效穩定的強化學習算法和框架

算法：提出 Test Difficulty Driven Reward 來緩解困難算法問題中的獎勵稀疏問題，并引入 Easy Data Re-Sampling 策略，以穩定 RL 訓練。

框架：設計了 Seamless Rollout 系統，使得 RL 訓練加速 2.29 倍，驗證加速 1.96 倍。

IT 之家附開源地址：

Hugging Face：https://huggingface.co/XiaomiMiMo

技術報告：https://github.com/XiaomiMiMo/MiMo/blob/main/MiMo-7B-Technical-Report.pdf

查看原文

宙世代

ZAKER旗下Web3.0元宇宙平臺

一起剪

ZAKER旗下免費視頻剪輯工具

日本一区二区三区久久-日本一区二区三区久久精品-日本一区二区三区日本免费-日本一区二区三区在线观看视频-国产不卡免费视频-国产不卡视频

宙世代元宇宙

元宇宙黨建解決方案

元宇宙文旅解決方案

元宇宙展廳解決方案

元宇宙行業峰會解決方案

元宇宙營銷解決方案

元宇宙會展解決方案

元宇宙演藝節目解決方案

元宇宙博物館解決方案

元宇宙圖書館解決方案

元宇宙校園解決方案

元宇宙企業展廳解決方案

元宇宙藝術展解決方案

元宇宙電商解決方案

融媒體解決方案

ZAKER智慧云

媒體解決方案

黨建解決方案

公檢法解決方案

智慧交通解決方案

高校解決方案

AI視頻剪輯

AI視頻剪輯

AI智能客服

AI工具箱

AI寫稿助手

AI口語陪練

我的訂閱

小米開源“ Xiaomi MiMo ”大模型：以 7B 參數超越 OpenAI o1-mini

宙世代

一起剪

相關閱讀

華為擎云L420x商務本重要規格確認：麒麟9000C、部分核心部件全自研

當了這么久“汪峰”，阿里的Qwen3終于喜提熱搜了。

ChatGPT可購物 OpenAI入局電商

火速適配國產算力！阿里Qwen3全家桶上線超算互聯網：支持企業級部署

上海光機所EUV光刻技術獲重大突破，中國芯片生產有望不再被美國“卡脖子”

一加13s上架印度官網：小屏用戶的夢中情機

萬興科技與華為云達成全新戰略合作，將共建AI聯合實驗室

AI戰略顯成效! 美年健康一季度AI營收增幅超70%

AI可以破解AI生成的驗證碼嗎？

藥企跨界美妝的故事，有點講不下去了

OPPO K13 Turbo塞進大風扇：性能最強的驍龍8s Gen4手機

新勢力 AI 大模型全對比：小鵬野心、理想務實、蔚來追趕

爆料稱，iPhone 17 Pro 屏幕「抗眩光」技術被蘋果放棄

融了3個億的張月光，就做出了個“AI播客播放器”？

Windows留不住自家人：微軟產品經理使用一小時火速換回macOS

最新評論

IT之家

熱門推薦