阿里发布并开源千问3,称成本仅需DeepSeek-R1三分之一
阿里云方面表示,性能大幅提升的同时,千问3的部署成本大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为DeepSeek-R1的三分之一。 4月29日凌晨,阿里巴巴宣布推出新一代通义千问模型Qwen3(千问3)并进行开源。阿里云方面表示,千问3是国内首个"混合推理模型",将"快思考"与"慢 思考"集成进同一个模型,参数量仅为DeepSeek-R1的1/3,成本大幅下降,并在ChatBot Arena等榜单中性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶 全球最强开源模型。知情人士对记者表示,这是今年上半年阿里云最核心的技术产品发布。 | | Qwen3-235B-A22B MoE | Qwen3-32B Dense | OpenAl-o 1 2024-12-17 | | --- | --- | --- | --- | | ArenaHard | 95.6 | 93.8 | 92.1 | | AIME'24 | 85.7 | 81.4 | 74.3 | | AIME'25 | 81.5 | 72.9 | 79.2 | | LiveCodeBench v5. 2024.10-2025.02 | 7 ...