Workflow
关税刷屏的一周,AI圈也“暗流涌动”:Llama 4来了,O3和O4-mini也要来了,DeepSeek R2和GPT-5也不远了?
SKLTYSeek .(SKLTY) 华尔街见闻·2025-04-06 07:01

本文作者:鲍奕龙 来源:硬AI 本周全球被关税议题占据头条,但科技界的目光却聚焦在AI领域的密集动作上。 周末,Meta深夜突袭发布Llama 4系列,号称"原生多模态+千万级上下文窗口",并首次披露单卡H100可运行的轻量化版本。此前OpenAI则宣布O3 和O4-mini模型即将在几周内上线,同时确认GPT-5因技术整合和算力部署问题推迟数月。 DeepSeek则与清华大学的研究团队本周联合发布了一篇关于推理时Scaling的新论文,提出了一种名为自我原则点评调优(SPCT)的学习方法,并 构建了DeepSeek-GRM系列模型。结合元奖励模型实现推理时扩展,性能接近671B大模型,暗示DeepSeek R2临近。 Meta强势推出Llama 4,多模态与超长上下文成亮点 周六,Meta正式发布了Llama 4系列模型,Llama 4全系采用混合专家(MoE)架构,并实现了原生多模态训练,彻底告别了Llama 3纯文本模型 的时代。此次发布的模型包括: 此次公布的Llama 4 Maverick 和 Llama 4 Scout 将是开源软件。然而,Llama 4 的新许可证对使用有一定限制,例如月活用户超 ...