Seek .-阿里发布并开源模型Qwen3，成本仅为DeepSeek-R1的1/3

4月29日凌晨，阿里巴巴开源新一代通义千问模型Qwen3（简称千问3），参数量仅为DeepSeek-R1的 1/3，成本大幅下降，性能全面超越R1、OpenAI-o1等领先模型，登顶全球最强开源模型。千问3是国内首个"混合推理模型"，将"快思考"与"慢思考"集成进同一个模型，大大节省算力消耗。根据官方的说法，千问3的旗舰版本 Qwen3-235B-A22B，在代码、数学、通用能力等基准测试中，达到了与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 同一梯度的水平。在奥数水平的 AIME25 测评中，Qwen3-235B-A22B 斩获 81.5 分，刷新了开源模型的纪录；在考察代码能力的 LiveCodeBench 评测中，Qwen3-235B-A22B 突破 70 分，表现甚至超过 Grok 3；在评估模型人类偏好对齐的 ArenaHard 测评中，Qwen3-235B-A22B 以 95.6 分超越 OpenAI-o1 及 DeepSeek-R1。 | | Qwen3-235B-A22B | Qwen3-32B | OpenAl-o1 | Dee ...