本站4月29日消息,今日,阿里云正式開源Qwen3系列模型,參數量為DeepSeek-R1的1/3,成本大幅下降。
今晚,國家級算力服務平臺超算互聯網宣布,平臺火速上線Qwen3全家桶,包含六個Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B;以及兩款MoE模型:Qwen3-235B-A22B(2350多億總參數、 220多億激活參數),Qwen3-30B-A3B(300億總參數、30億激活參數)。
Qwen3系列模型采用Apache2.0協議開源,開發者、企業可在超算互聯網下載模型文件進行快速開發。
超算互聯網表示,平臺即將上線Qwen3系列模型鏡像、應用空間快速體驗服務,無需安裝依賴,用戶可0代碼體驗Qwen3系統模型對話服務,實現云端開箱即用。
據介紹,Qwen3-235B-A22B在編碼、數學、通用能力等基準評測中表現出競爭力,能夠與DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等模型媲美。
此外,小型MoE模型Qwen3-30B-A3B以激活參數數量的10倍優勢超越了QwQ-32B,Qwen3-4B小型模型也能匹敵Qwen2.5-72B-Instruct的性能。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。