Workflow
计算机周报:Deepseek日活数持续突破,国产AI产业链有望形成闭环
国都证券·2025-03-05 01:47

一、摘要: Deepseek 通过算法结构的优化,实现了 AI 模型的大幅降本增效,同时 通过蒸馏技术,成功地将自身知识迁移到了更小的模型中。其中,32B 和 70B 版本的性能超越了 GPT-4o、Claude3.5Sonnet,接近 o1-mini。同 时,1.5B 参数模型性能与 GPT4o 相当,适用于资源有限的设备(如 PC 或手机),极大降低了 AI 技术的使用门槛。此外,据 QuestMobile 数 据显示,DeepSeek 在 1 月 28 日的日活跃用户数首次超越豆包,随后在 2 月 1 日突破 3000 万大关,成为史上最快达成这一里程碑的应用。目 前国内主流云平台,如百度智能云、华为云、腾讯云、火山引擎、天翼 云等,均陆续上线了相关模型,支持公有云在线部署、专混私有化实例 部署等模式,希望吸引更多客户使用其算力和服务。此外,多家国产芯 片厂商也都在纷纷响应,华为、摩尔线程、海光信息于近期宣布了适配 支持。当前主流国产芯片已基本实现对 DeepSeek 蒸馏版小模型的兼容 支持。这意味着任何能够运行 Llama、Qwen 等常见开源模型的设备, 现可无缝运行 DeepSeek 的蒸馏版小 ...