當OpenAI和谷歌在生成式AI賽道狂奔時,Meta卻因Llama 4的失利陷入被動,現在,這一巨頭正準備用兩套截然不同的方案破局。
4月,Llama 4發布后的種種失誤表現將Meta推上了風口浪尖,同時被批評的還有Meta首席人工智能科學家楊立昆(Yann LeCun),作為曾經的圖靈獎得主、有著數千億美元的資源,卻堅決反對主流LLM路線,而目前Meta已經在海外AI大廠的競爭中落后了。
在這個時間點,楊立昆看起來需要用新的成果來證明自己。北京時間6 月 12 日,他親自出鏡介紹了Meta最新的人工智能模型 V-JEPA 2,這是一種不同于當前主流Transformer架構的“世界模型”,旨在幫助機器和其他AI助手理解和駕馭周圍的世界。
但這條“非主流”路線真的能成功嗎?看起來Meta CEO扎克伯格(Mark Zuckerberg)也不確定,就在這兩日,他被曝親自下場招人,組建新的AI團隊,并高薪挖來谷歌DeepMind的首席研究員?,另一邊投資千億元押注初創公司Scale AI,邀請CEO加入新的AI團隊。
面對當前AI戰略的失利,扎克伯格顯然選擇了“不把雞蛋放在一個籃子里”。有消息稱過去兩個月他已回歸“創始人模式”,扎克伯格認為,與其他科技巨頭相比,Meta不僅有能力,更有責任率先實現AGI。
楊立昆押注“非主流”模型
自大模型崛起以來,楊立昆就一直唱衰自回歸生成路線,而目前以ChatGPT、Gemini為主的模型大都是沿著這一路線發展壯大的。他認為,雖然自回歸LLM充斥了整個AI界,但存在事實錯誤、邏輯錯誤、不一致、推理有限等缺陷。
在楊立昆看來,讓機器理解物理世界與讓它們理解語言是截然不同的,自回歸 LLM 僅僅是世界模型的一種簡化的特殊情況。而世界模型則真正提供了一個虛擬的現實世界,人工智能可以參考它來理解世界,預測其行為的后果,因此它將能夠計劃一個行動方案來完成給定的任務。
為了實現世界模型,楊立昆認為應該放棄當前的生成模型,支持聯合嵌入架構,放棄強化學習,支持模型-預測控制。V-JEPA 2就是這一路線的最新成果。
根據官方博客,V-JEPA 2基于Meta在2022年提出的聯合嵌入預測架構(JEPA)構建,2024年,Meta發布了第一個版本V-JEPA,在此基礎上,V-JEPA 2 改進了動作預測和世界建模功能,使機器人能夠與不熟悉的物體和環境交互以完成任務。
首先需要理解什么是楊立昆認為的世界模型。在團隊看來,預測世界將如何回應我們的行為,這種能力是人類一直以來都在運用的,尤其是在規劃行動以及如何最好地應對新情況時。而世界模型需要有這種能力。
“當我們穿過陌生擁擠的區域時,我們會一邊朝著目的地前進,一邊努力避免撞到沿途的人或障礙物。用爐子做飯時,我們會考慮鍋還要燒多久,或者是否要調低火候?!盡eta在博客中介紹,我們內在的世界模型為我們提供了這種對世界的直覺,還充當著一個內在模擬器,讓我們能夠預測假設行動的結果,最終根據直覺最能實現目標的方式,選擇最好的行動。
上述身體直覺并非成年人經過多年教育獲得的,而是幼兒在能夠說出完整句子之前,就通過觀察周圍的世界培養出了這種直覺。V-JEPA 2模型也是通過這種“觀察世界”的方式進行訓練的。
據介紹,預訓練階段,團隊使用了來自不同來源的超過 100 萬小時的視頻和 100 萬張圖像,這些視覺數據有助于模型了解世界的運作方式,包括人與物體的互動方式、物體在物理世界中的移動方式等等。
在預訓練階段之后,模型已經展現出與理解和預測相關的關鍵能力。隨后,基于預測能力,世界模型可以規劃行動。Meta表示,V-JEPA 2擁有12億參數,可以幫助機器人或其他AI 智能體在物理世界中運行。
根據Meta的說法,V-JEPA 2比英偉達的Cosmos模型快30倍,英偉達也試圖發展與物理世界相關的人工智能。
楊立昆認為,世界模型將為機器人技術開啟一個新時代,讓現實世界中的AI助手能夠在不需要海量訓練數據的情況下,幫助人們完成家務和體力勞動。
“很高興看到 V-JEPA 2 如何改變這場游戲?!痹赬平臺官方的評論區中,有網友表示,在這場大模型的戰爭中,不一樣的聲音看起來會更有趣。
不過,也有人認為,“解決魔方應該是這些世界/機器人模型的圖靈測試,通用智能模型已經做到了嗎?”世界模型要如何證明其能力,目前Meta還沒有給出直觀的答案。
扎克伯格“另起爐灶”
楊立昆所堅持的這一路線未來真的能與當前主流的LLM大模型一戰嗎?短期內誰也沒有答案。但因反對主流路線,且沒有給出更優的成果,楊立昆承擔了不少來自內部和外界的壓力。
就在4月,Meta發布了最新的Llama 4模型,但隨后被認為性能不佳、測試作弊,同時內部員工直接辭職,引發爭議。在目前的各大模型榜單中,Llama 模型也已經落后于同類競爭對手GPT/o系列、Gemini 和Claude,在開源社區中也面臨國內DeepSeek和 Qwen的壓力。
外界將Meta在大模型大戰中落后的原因歸結于楊立昆,作為AI團隊的決策者,卻不相信當前的技術路線,作為圖靈獎得主、神經網絡的先驅的他似乎過于自信和教條主義,導致了Meta當前的局面。
不過,楊立昆曾經表示,他嘗試了20年的自回歸預測,徹底失敗,才不看好LLM路線。但至少當前不少前沿的公司在LLM路線上做出了成績,也逐步在推動AI能力的進展。
此前外界曾猜測,楊立昆是否會為此離職,但從他此次親自發布世界模型來看,地位還很穩固。但扎克伯格并不淡定,他近日正高調下場創建一個新的AI團隊“超級智能”,看起來是多面布局,以規避在這一浪潮中落后的風險。
據外媒消息,扎克伯格計劃為超級智能組招募約50名頂尖 AI 專家,并將向這些人員提供為期數年、價值數千萬美元的薪酬方案,包括股權激勵。扎克伯格將親自進行初步接洽并全程跟進,他的目標是“讓Meta成為AGI領域的領導者”,并將其能力整合到Meta的全系產品中。
就在6月12日,有消息稱谷歌 DeepMind 首席研究員杰克·雷(Jack Rae) 預計將加入Meta 的超級智能團隊,他此前在谷歌 DeepMind 工作了兩年,負責 Gemini 的“思考”相關進展。另有消息稱,AI語音初創公司 Sesame AI 的機器學習負責人約翰·沙爾克維克(Johan Schalkwyk)也已被 Meta 招募。上述二人都將會加入Meta的“超級智能”團隊。
前兩日,Meta還被曝斥巨資數十億美元(有消息稱是150億美元,未被確認)投資初創公司Scale AI,CEO汪滔(Alexandr Wang)和多位研究人員將加入“超級智能”。Scale AI的主要業務是數據標注,目前估值超過百億美元,預計今年營收超過20億美元。在過去的幾年里,OpenAI 等AI大廠一直依靠 Scale AI 來生成和標記用于訓練模型的數據。
扎克伯格認為,與依賴融資的對手不同,Meta強大的廣告業務現金流足以支撐其在AI領域的巨額投入,并認為Meta有能力建設擁有世界頂級算力的數據中心。此前在財報中,Meta預計2025 年總資本開支將在640-720 億美元之間,高于年初的指引,公司透露會持續增加數據中心和基礎設備投資以支持AI 相關工作。
一面是楊立昆執著探索的、可能顛覆現狀的“世界模型”,另一面是扎克伯格重金押注、沿主流方向加速追趕的“超級智能”,這場關乎未來AI格局的豪賭,Meta選擇了以雙線并進的方式布局,成敗或將決定這家公司能否回到AI巔峰。
幫企客致力于為您提供最新最全的財經資訊,想了解更多行業動態,歡迎關注本站。鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。