20/03/2026 11:35
【AI】Qwen3.5預覽版模型首亮相,阿里居中國大模型公司排行首位
今日,阿里巴巴千問最新旗艦模型預覽版Qwen3.5-Max-Preview首次亮相全球大模型競技平台LM Arena,並獲得1464分的綜合得分。憑借這一成績,阿里千問在LM Arena全球大模型公司排行榜升至全球第五位,位列中國公司首位;字節、智譜、月之暗面、百度等五家中國公司進入全球前十。
據阿里雲介紹,LM Arena是由國際開源研究機構LMSYS組織的第三方大模型評測平台,其評測機制採用模型兩兩匿名對戰,由全球開發者進行盲測投票,最終根據勝負結果形成模型分數與排名。由於採用開放式對戰與人工評估相結合的方式,該榜單被業界視為當前最具參考價值的大模型性能評測之一。
在本次評測中,Qwen3.5-Max-Preview在沒有風格控制(without style control)的絕對勝率比拼中,整體性能排名全球第六。在細分任務層面,該模型的數學能力排名全球第五,專家級文本處理能力排名全球第十。此次亮相也是千問3.5系列首次以旗艦級模型身份參與國際第三方評測。
《經濟通通訊社20日專訊》
據阿里雲介紹,LM Arena是由國際開源研究機構LMSYS組織的第三方大模型評測平台,其評測機制採用模型兩兩匿名對戰,由全球開發者進行盲測投票,最終根據勝負結果形成模型分數與排名。由於採用開放式對戰與人工評估相結合的方式,該榜單被業界視為當前最具參考價值的大模型性能評測之一。
在本次評測中,Qwen3.5-Max-Preview在沒有風格控制(without style control)的絕對勝率比拼中,整體性能排名全球第六。在細分任務層面,該模型的數學能力排名全球第五,專家級文本處理能力排名全球第十。此次亮相也是千問3.5系列首次以旗艦級模型身份參與國際第三方評測。
《經濟通通訊社20日專訊》
【你點睇?】宏福苑火災聽證會揭多項漏洞,你認為反映主要問題是甚麼?► 立即投票
-
上一篇
【AI】白宮擬將在數日內發布人工智能監管框架 20/03/2026 12:00
-
下一篇
【AI】國資委:編制好中央企業人工智能產業發展「十五五」規劃 20/03/2026 10:19
-
【AI】阿里媽媽推出「AI萬相」超級經營智能體引擎 20/03/2026 16:58
-
【AI】字節據報逾60億美元售沐瞳科技,市場解讀為進一步聚… 20/03/2026 15:56
-
【AI】騰訊QClaw開啟全量公測,無需邀請碼、下載即可使用 20/03/2026 13:58
-
【AI】雷軍:未來三年在AI領域至少投入600億元 20/03/2026 08:33
-
【AI】美國指控超微電腦高層,走私英偉達芯片到中國 20/03/2026 08:28