本文來自微信公眾號(hào):劃重點(diǎn) KeyPoints,作者:林易
要問大洋彼岸硅谷現(xiàn)在最 fashion 的話題是什么,絕不是哪個(gè)新模型,也不是什么新芯片,而是由 Meta 老板扎克伯格引發(fā)的 AI 人才搶奪大戰(zhàn),直接讓硅谷各大科技巨頭如坐針氈。OpenAI 首席研究官 Mark Chen 甚至罕見情緒化發(fā)聲,說 " 感覺被偷家 "。
這場放歷史長河里都堪稱罕見的 "Boss 直聘 ",扎克伯格拿出的手腕也是相當(dāng)直截了當(dāng)——砸錢,狠狠地砸錢。根據(jù)《連線》雜志的說法,Meta 已經(jīng)向一些頂級(jí) AI 人才提供了為期四年、高達(dá) 3 億美元的薪酬方案,第一年的薪酬更是超過 1 億美元。
那么這些頂級(jí) AI 人才都有誰?隨著扎克伯格前兩天官宣成立 " 超級(jí)智能實(shí)驗(yàn)室 "(Meta Superintelligence Labs,MSL),一份 " 華人含金量 " 超高的首批成員名單也一道被曬出:11 人中有 7 人是華人,多數(shù)來自 OpenAI 和谷歌 DeepMind。
而在 " 小扎搶人 "、"Meta 新團(tuán)隊(duì) " 和 " 首批名單 " 等眾多熱點(diǎn)話題之下,卻有一位華人在 X 上脫穎而出,獨(dú)立成為了另一個(gè)大熱點(diǎn)——余家輝。原因無他,正是因?yàn)橛袀餮苑Q他就是 " 轉(zhuǎn)會(huì)費(fèi) " 第一年高達(dá) 1 億美元那個(gè)人(也是 " 超級(jí)智能實(shí)驗(yàn)室 " 的首批成員)。
言外之意,從總包這個(gè)角度來看,有人可能真的能夠到一億的門檻。如果這個(gè)人是余家輝,那么 Meta 簽下他,比當(dāng)年皇家馬德里花 8000 萬美元簽 C 羅還要燒錢;但 C 羅在 5 年時(shí)間里帶領(lǐng)皇馬拿下 5 次歐冠冠軍,他帶來的回報(bào)可以說是等值或者超值。
于是,很多人對(duì)于余家輝加入 Meta 這件事提出了不少的疑惑——
他的薪酬到底值不值這個(gè)錢?他又能給 Meta 帶來多大的回報(bào)?
余家輝 AI 技術(shù)實(shí)力幾何?
余家輝本科畢業(yè)于中國科學(xué)技術(shù)大學(xué)少年班計(jì)算機(jī)科學(xué)專業(yè),在中科大的求學(xué)過程中,他不僅積累了相關(guān)的專業(yè)知識(shí),也培養(yǎng)起對(duì)計(jì)算機(jī)科學(xué)研究的興趣和較為嚴(yán)謹(jǐn)?shù)膽B(tài)度。
之后,余家輝前往美國,在伊利諾伊大學(xué)厄巴納 - 香檳分校攻讀博士學(xué)位。期間,余家輝有幸?guī)煆挠?jì)算機(jī)視覺領(lǐng)域先驅(qū) Thomas S. Huang 教授(黃煦濤,已故)。黃煦濤教授在圖像編碼、多媒體、計(jì)算機(jī)視覺和人機(jī)交互等領(lǐng)域有諸多成果,獲得中、美、英三國院士及 IEEE 終身會(huì)士榮譽(yù) 。成為黃煦濤教授的學(xué)生,余家輝也開啟了他在 AI 領(lǐng)域較為特別的探索之路。
在博士求學(xué)期間,余家輝便顯露出卓越的科研天賦。他在 Adobe 實(shí)習(xí)期間深度參與了 "DeepFill" 項(xiàng)目,該項(xiàng)目成功運(yùn)用 AI 技術(shù)實(shí)現(xiàn)照片中物體的智能去除與修復(fù),效果顯著。這一成就不僅證明了他在圖像處理領(lǐng)域的專業(yè)實(shí)力,更讓他深刻認(rèn)識(shí)到 AI 技術(shù)在實(shí)際應(yīng)用中的巨大潛力。
除此之外,在整個(gè)求學(xué)期間,他便在多家知名公司實(shí)習(xí),包括微軟亞洲研究院、曠視、Snapchat、百度、英偉達(dá)等等。
畢業(yè)后,余家輝的職業(yè)軌跡可謂星光熠熠。他相繼在 Google Brain、OpenAI 等頂尖 AI 研究機(jī)構(gòu)任職,每一段經(jīng)歷都為其學(xué)術(shù)生涯添上濃墨重彩的一筆。
在 Google Brain 期間,他不僅參與了谷歌旗艦?zāi)P?Gemini 的多模態(tài)團(tuán)隊(duì)工作,更在一定程度上承擔(dān)了領(lǐng)導(dǎo)職責(zé)。Gemini 作為谷歌推出的多模態(tài)大語言模型,集語言理解、圖像識(shí)別與生成等多項(xiàng)能力于一身,發(fā)布后在 AI 學(xué)界掀起熱烈討論。
余家輝專注于多模態(tài)融合技術(shù)的深入研究,致力于讓 AI 系統(tǒng)能夠無縫處理文字、圖像、音頻等多種信息形態(tài)。他的研究貢獻(xiàn)為 Gemini 的技術(shù)突破提供了重要支撐,也使其在多模態(tài) AI 領(lǐng)域確立了權(quán)威地位。
2023 年,余家輝轉(zhuǎn)戰(zhàn) OpenAI,出任感知團(tuán)隊(duì)(Perception Team)負(fù)責(zé)人。感知團(tuán)隊(duì)在 GPT 模型體系中占據(jù)核心地位,主要負(fù)責(zé)賦予模型對(duì)外部世界的認(rèn)知和理解能力。在 OpenAI 任職期間,余家輝深度參與了 GPT-4o、GPT-4.1 等里程碑式模型的研發(fā)工作,帶領(lǐng)團(tuán)隊(duì)攻克了多項(xiàng)技術(shù)難關(guān),推動(dòng) GPT 系列在多模態(tài)感知與理解方面實(shí)現(xiàn)重大飛躍。這些成就進(jìn)一步奠定了他在 AI 領(lǐng)域的影響力和聲望。
這篇論文不僅展示了谷歌當(dāng)時(shí)最新 AI 模型的性能突破,還為業(yè)界樹立了多模態(tài)模型的新標(biāo)桿。Gemini 不再只是一個(gè) " 對(duì)話模型 ",它已經(jīng)是一個(gè)能聽、看、讀、寫、思考的通用 AI 智能體雛形,在多個(gè)任務(wù)中表現(xiàn)優(yōu)異,部分能力已超越人類專家水平,意味著通用人工智能(AGI)又邁出了一大步。
Conformer 模型在模塊設(shè)計(jì)上展現(xiàn)出諸多創(chuàng)新。其多頭自注意力(MHSA)模塊引入了 Transformer-XL 的相對(duì)正弦位置編碼方法,顯著提升了模型對(duì)不同長度語音輸入的適應(yīng)能力;卷積模塊以點(diǎn)卷積和門控線性單元(GLU)為起點(diǎn),結(jié)合一維深度卷積層,有效捕捉語音的局部特征;前后兩個(gè)前饋模塊則采用 Macaron-net 風(fēng)格的半殘差結(jié)構(gòu),進(jìn)一步增強(qiáng)了模型性能。
在 LibriSpeech 基準(zhǔn)測試中,Conformer 模型表現(xiàn)出色——在不使用語言模型的情況下,test/test-other 數(shù)據(jù)集上的詞錯(cuò)誤率(WER)分別為 2.1% 和 4.3%;結(jié)合外部語言模型后,WER 進(jìn)一步降低至 1.9% 和 3.9%。即便是僅有 10M 參數(shù)的小型模型,也超越了以往基于 Transformer 和 CNN 的模型,充分體現(xiàn)了余家輝及其團(tuán)隊(duì)在技術(shù)創(chuàng)新方面的卓越能力。
扎克伯格的 AI 困境
曾在社交媒體領(lǐng)域呼風(fēng)喚雨的科技巨頭 Meta,如今在 AI 浪潮的沖擊下,也面臨著前所未有的挑戰(zhàn)與機(jī)遇。近年來,Meta 大力投入 AI 研發(fā),致力于打造具有競爭力的智能產(chǎn)品,Llama 系列模型正是其中的重要成果之一。然而,Llama 的發(fā)展之路并非坦途,在性能與口碑方面都遭遇了諸多難題。
在性能層面,Llama 模型與 OpenAI 的 GPT-4o 等先進(jìn)模型仍存在明顯差距。在多個(gè)關(guān)鍵的自然語言處理任務(wù)中,例如文本生成的邏輯性與連貫性、問答系統(tǒng)的準(zhǔn)確性與全面性,Llama 的表現(xiàn)尚難令人滿意。
面對(duì)復(fù)雜的語義理解與推理任務(wù)時(shí),Llama 往往出現(xiàn)誤判或回答模糊,難以像 GPT-4o 那樣精準(zhǔn)把握問題核心,輸出清晰而合理的解答。這使得 Llama 在市場競爭中處于劣勢(shì),難以有效吸引用戶和開發(fā)者的青睞。
在口碑方面,Llama 也未能贏得廣泛認(rèn)可。因性能不足,Llama 在開源社區(qū)和商業(yè)用戶中頻頻受到質(zhì)疑。一些開發(fā)者反映其訓(xùn)練過程資源消耗大、效果不穩(wěn)定;而部分企業(yè)用戶則擔(dān)憂其在實(shí)際部署中的表現(xiàn),認(rèn)為可能影響產(chǎn)品質(zhì)量與用戶體驗(yàn)。這些負(fù)面反饋進(jìn)一步削弱了 Llama 的市場競爭力,導(dǎo)致 Meta 在 AI 領(lǐng)域的份額被逐步蠶食。
與此同時(shí),Meta 還面臨 AI 核心人才流失的問題。由于對(duì)公司 AI 戰(zhàn)略的疑慮以及對(duì) Llama 模型前景的失望,不少優(yōu)秀的研究人員選擇離職,轉(zhuǎn)而尋求更具潛力的發(fā)展平臺(tái)。這種人才流失無疑對(duì) Meta 的技術(shù)創(chuàng)新和產(chǎn)品迭代造成了實(shí)質(zhì)性影響,研發(fā)節(jié)奏明顯放緩。
即便有圖靈獎(jiǎng)得主、深度學(xué)習(xí)三巨頭之一的 Yann LeCun 坐鎮(zhèn) FAIR,也未能改變 Meta 在 AI 時(shí)代落后的局面;甚至不少人由于 LeCun 與主流 AI 大模型發(fā)展背道而馳的理念,將這種落后的原罪歸咎到了他的身上。
在此背景下,扎克伯格啟動(dòng)了 " 超級(jí)智能團(tuán)隊(duì) " 計(jì)劃,力圖通過鈔能力吸引頂尖人才,突破當(dāng)前的技術(shù)瓶頸,提升 Meta 在 AI 領(lǐng)域的整體競爭力。
就目前來看,新團(tuán)隊(duì)負(fù)責(zé)人 Alexandr Wang(前 Scale AI CEO)和 Nat Friedman(前 GitHub CEO),以及以余家輝為代表的首批 11 名成員的加入和官宣等動(dòng)作,已經(jīng)在網(wǎng)絡(luò)和市場中產(chǎn)生了 " 人才磁場 " 的效應(yīng)。
然而對(duì)于扎克伯格來勢(shì)洶洶的挖角行動(dòng),OpenAI CEO 奧特曼也沒有坐以待斃。在更早前的內(nèi)部舉措中,奧特曼已對(duì) OpenAI 的內(nèi)部狀態(tài)發(fā)出了警示。他決定讓員工集體休假一周,暫停此前人均每周超過 80 小時(shí)的高強(qiáng)度工作節(jié)奏,并暗示正在重新評(píng)估薪酬體系和激勵(lì)機(jī)制,以應(yīng)對(duì)當(dāng)前 AI 行業(yè)的人才競爭態(tài)勢(shì)。
而在最新的一封內(nèi)部信中,奧特曼直接批評(píng)了 Meta 近期的挖角行為。他表示,OpenAI 曾是一群 " 默默無聞的技術(shù)書呆子 ",如今卻成為了科技行業(yè)最受關(guān)注的一群人。然而他也指出,AI 領(lǐng)域當(dāng)前的輿論環(huán)境異常喧囂,Meta 的行事方式尤為令人不滿,未來這類現(xiàn)象可能愈演愈烈。
奧特曼坦言,盡管 Meta 確實(shí)從 OpenAI 招募了一些優(yōu)秀員工,但整體而言,并未成功挖走核心頂尖人才,最終只能在 " 人才名單的后半段 " 作出妥協(xié)。他還半開玩笑地表示,自己已經(jīng)記不清扎克伯格到底希望從 OpenAI 挖走多少人來擔(dān)任首席科學(xué)家。
他強(qiáng)調(diào),OpenAI 在推動(dòng)整個(gè)行業(yè)發(fā)展方面取得的成就令人自豪,但 " 在人才流動(dòng)中,總會(huì)有部分人選擇逐利而行 "。
奧特曼進(jìn)一步指出,Meta 的這種激進(jìn)挖角方式可能帶來深層次的文化隱患,長遠(yuǎn)來看難免會(huì)造成負(fù)面影響。他判斷,Meta 或?qū)⒑芸燹D(zhuǎn)向新的市場熱點(diǎn),或者繼續(xù)圍繞自身 " 護(hù)城河 " 進(jìn)行防御性戰(zhàn)略調(diào)整。
相比之下,他重申 OpenAI 的核心使命始終堅(jiān)定,即以實(shí)現(xiàn)通用人工智能(AGI)為首要目標(biāo),并認(rèn)為這種長期主義導(dǎo)向與團(tuán)隊(duì)文化是其他公司難以比擬的。" 傳教士的力量,永遠(yuǎn)勝過雇傭兵。" 他如是說道。
不過有一說一,在了解完這個(gè)故事和人之后,我們從中應(yīng)當(dāng)也是有所收獲。首先就是余家輝的成長軌跡,可以說是為當(dāng)代計(jì)算機(jī)專業(yè)的學(xué)生提供了極具參考價(jià)值的范本。
他的經(jīng)歷證明,在 AI 時(shí)代,扎實(shí)的學(xué)術(shù)功底依然重要,尤其是在數(shù)學(xué)、算法、模型架構(gòu)等底層技術(shù)上的沉淀。同時(shí),實(shí)習(xí)和項(xiàng)目經(jīng)驗(yàn)也尤為關(guān)鍵,從 Adobe 到 Google、OpenAI,余家輝始終在科研與工程之間游走,不斷提高問題解決能力和技術(shù)落地能力。對(duì)于想在 AI 領(lǐng)域獲得高薪與影響力的年輕人而言,提早參與科研項(xiàng)目、注重系統(tǒng)性思維、并積極爭取加入頂尖實(shí)驗(yàn)室或團(tuán)隊(duì),依然是當(dāng)前最具確定性的路徑。
其次是扎克伯格的 "Boss 直聘 " 風(fēng)波所影射出來的 AI 發(fā)展現(xiàn)狀。他用 " 鈔能力 " 砸出的超級(jí)團(tuán)隊(duì),雖在聲勢(shì)上確實(shí)令 OpenAI 和谷歌等對(duì)手感受到壓力,但真正的挑戰(zhàn)才剛剛開始。AI 的競爭,歸根到底還是 " 組織能力 " 的競爭。一個(gè)頂尖人才的價(jià)值,在于其與周圍團(tuán)隊(duì)的協(xié)作能力、能否主導(dǎo)從 0 到 1 的技術(shù)創(chuàng)新流程。Meta 當(dāng)前引入的 Alexandr Wang、Nat Friedman、余家輝等,雖都是明星選手,但這支夢(mèng)之隊(duì)是否能形成合力?能否扭轉(zhuǎn) Meta 在大模型競賽中的被動(dòng)局面?目前仍存在較大不確定性。
而 Meta 過去在 FAIR 團(tuán)隊(duì)的組織困境與方向搖擺,也讓外界對(duì)其管理能力持保留態(tài)度。接下來的關(guān)鍵,不僅是技術(shù)攻堅(jiān),更是組織設(shè)計(jì)與戰(zhàn)略落地的真正考驗(yàn)。
參考鏈接:
1、《連線》報(bào)道:https://www.wired.com/story/mark-zuckerberg-meta-offer-top-ai-talent-300-million/
2、余家輝谷歌學(xué)術(shù):https://scholar.google.com/citations?hl=en&user=-CLCMk4AAAAJ&view_op=list_works
3、余家輝領(lǐng)英:https://www.linkedin.com/in/jhyuxm/