电子行业先进科技主题周报:周观点,海外大厂发布Q4财报,DeepSeek降低训练与推理成本
上海证券·2025-02-08 03:20
周观点: 海外大厂发布 Q4 财报, DeepSeek 降低训练与推理成本 ——先进科技主题周报 20250127-20250202 [Table_Rating] 增持(维持) [◼Table_Summary] 主要观点 ——2025 年 01 月 21 日 【市场回顾】 ◆ 幻方量化旗下 AI 公司深度求索(DeepSeek)发布 DeepSeek-V3 模型,并同步开源,成本仅为 557 万美元,较 OpenAI 7800 万美 元的 GPT-4 训练成本大幅降低。DeepSeek-V3 是全球前十中性 价比最高的模型,在复杂问题和代码领域表现均位列前三,是首 个综合实力匹敌 Meta 的 Llama3.1-405B 的国产开源大模型。成 本方面,DeepSeek 现在 API 的输入价格为每百万 Token 0.1 元 人民币,而 Claude3.5 Sonnet API 输入价格为每百万 Token 3 美 元。 技术方面,DeepSeek-V3 是首个创新融合使用了 FP8、 MLA、MoE 三项技术的大模型,其利用混合专家 (MoE)架构来优 化性能,在每次处理过程中仅激活 6710 亿个参数中的 ...