阿里Qwen3深夜开源,8款模型、集成MCP,性能超DeepSeek-R1,2小时狂揽16.9k星
此次全新升级的Qwen3系列有以下5大关键特性: 8种参数大小的稠密与MoE模型:0.6B、1.7B、4B、8B、14B、32B和Qwen3-235B-A22B(2350亿总参数和220亿激活参数)、Qwen3-30B-A3B(300亿总 参数和30亿激活参数); 引入混合思考模式:用户可切换"思考模式、"非思考模式",自己控制思考程度; 推理能力提升:在数学、代码生成和常识逻辑推理方面超越QwQ(在思考模式下)和Qwen2.5 instruct models(在非思考模式下); 阿里通义大模型新成员Qwen3系列模型终于亮相! 智东西4月29日报道,今日凌晨4点,阿里云正式开源Qwen3系列模型,包含2个MoE模型、6个稠密模型。发布2小时,Qwen3模型在GitHub上的star数已超 过16.9k。 | Product v | Solutions v | Resources v | Open Source v Enterprise V | | Pricing | | | | Q | Sign in | Sign up | | --- | --- | --- | --- | --- | --- | --- ...