|
|
本帖最后由 亦书 于 2026-4-12 19:20 编辑
AI 周报 | 2026 年 4 月 5 日 - 4 月 12 日:GPT-6 定档 4 月 14 日,全球大模型进入 "神仙打架" 时代
本周头条
OpenAI 官宣 GPT-6 将于 4 月 14 日全球发布,代号 "土豆",性能提升 40%
4 月 6 日,OpenAI 官方正式确认,代号 "Spud (土豆)" 的新一代旗舰大模型 GPT-6 将于 4 月 14 日全球同步发布。这是继 GPT-5 以来最重要的产品迭代,被 OpenAI 内部定位为 "AGI 最后一公里"。
核心参数与突破:
- 预训练于 3 月 17 日完成,耗时 18 个月,动用约 10 万张 H100 GPU,训练成本超 20 亿美元
- 综合性能较 GPT-5.4 全面提升约 40%,代码生成通过率达 96.8%,数学推理准确率提升至 92.5%
- 上下文窗口从 100 万 Token 翻倍至200 万 Token,相当于单次处理 150 万字文本或 2 小时高清视频全帧内容
- 采用 "Symphony" 原生多模态架构,将文本、图像、音频、视频纳入同一向量空间,彻底告别过去的 "拼接式" 多模态
- 引入双系统推理框架:System-1 快速响应(类似人类直觉),System-2 深度推理(类似人类逻辑验证)
- 定价保持不变:每百万 Token 输入$2.5,输出$12
值得注意的是,为集中算力支持 GPT-6,OpenAI 已关停 Sora 视频生成项目。发布后,ChatGPT Plus 和 Pro 用户将优先体验。
大模型更新
国际厂商
- Meta 发布首款闭源旗舰模型 Muse Spark(4 月 8 日):代号 "牛油果",投入 150 亿美元打造,支持三级推理模式(快速响应、深度思考、超级推理),在 CharXiv 基准测试中斩获 86.4 分,刷新多模态理解纪录,已在 Meta AI 助手和 Ray-Ban 智能眼镜中商用
- Google 正式开源 Gemma 4 系列(4 月 11 日):包含 2B、7B 和 27B 三个规格,采用 Apache 2.0 许可证,在 MMLU 基准测试中提升 12%,首次在 7B 参数规模下超越 Llama 3-70B,推理效率提升 40%,Hugging Face 下载量单日突破 50 万次
- Anthropic 推出 Claude Opus 4.5:在代码理解、数学推理和多模态理解方面显著提升,上下文窗口扩展至 200K,HumanEval 测试准确率达 92.3%,逼近 GPT-4.5 水平
国内厂商
- 字节跳动发布全双工语音大模型 Seeduplex(4 月 9 日):实现 "边听边说" 的同步处理框架,误回复率与误打断率降低 50%,判停延迟缩短约 250ms,抢话比例下降 40%,已在豆包 App 全量上线
- DeepSeek V4 开启灰度测试(4 月 8 日):新增 "快速模式" 和 "专家模式" 两档,快速模式主打即时响应(2 秒内出结果),专家模式聚焦复杂问题与深度推理,知识更新截止到 2026 年 4 月
- 阿里 Qwen3.6-Plus 登顶 OpenRouter 全球大模型调用榜:单日调用量破万亿 Token,默认支持 100 万 Token 超长上下文,编程、智能体及工具调用能力对标 Claude,输入价格低至每百万 Tokens 2 元
- 智谱 GLM-5.1 编程能力首超 GPT-5.4:国产算力闭环跑通,在多项编程基准测试中取得领先成绩
产品与应用
- AI 陪伴产品迎来春季发布潮:4 月 8 日,北京心忆科技发布 "心忆康康" 情感陪伴机器人;4 月 9 日,深圳玩具展上多家企业发布全新 IP 和轻算力 AI 陪伴解决方案。数据显示,AI 陪伴产品成本已下降 50%-70%
- 特斯拉 FSD 首次登陆欧盟(4 月 11 日):获得荷兰交通主管部门商用批准,累计超 10 亿英里道路测试数据显示事故率比人类驾驶员低约 30%,为特斯拉自动驾驶全球化布局打通关键市场通道
- 谷歌推出 Eloquent 离线 AI 听写应用:基于 Gemma 4 实现 100% 离线语音转写,自动过滤语气词,支持多种语言
行业动态与政策
- 中国 AI 大模型周调用量连续五周超越美国:据 OpenRouter 最新数据,中国最新一周达到 12.96 万亿 Token,环比暴涨 31.48%;美国仅为 3.03 万亿 Token,环比微增 0.76%
- 工信部发布普惠算力赋能中小企业专项行动:提出到 2028 年底基本建成覆盖广、成本低、服务优的普惠算力服务体系,在 15 类行业中覆盖门类不少于 10 类,显著降低中小企业获取、使用算力门槛
- 工信部等十部门印发《人工智能科技伦理审查与服务办法(试行)》:明确开展人工智能科技伦理审查重点关注人类福祉、公平公正、可控可信等方面,包括训练数据选择标准、算法设计合理性等
- 北京海淀发布八条 OPC 举措:鼓励科技人才创办 OPC 企业,给予最高 10 万元创业资金支持;对优质 OPC 企业给予模型券补贴,每家每年补贴上限不超过 200 万元
- 第三届中国具身智能大会在合肥召开(4 月 10 日 - 12 日):聚焦多模态感知、自主决策、运动控制、人机交互等核心技术突破,展示了最新的具身智能产品和解决方案
资本与融资
- 面壁智能完成新一轮数亿元融资:由深创投和汇川产投联合领投,一季度累计融资规模超 10 亿元,正式跻身基座大模型独角兽行列
- 众擎机器人完成 2 亿美元 B 轮融资:由河南投资集团汇融基金领投,立讯精密战略入局,公司估值突破百亿元人民币,标志着具身智能商业化落地速度加快
技术前沿
- 谷歌 Orchestra AI 系统实现学术论文端到端自动撰写:能够从研究问题出发,自动完成文献综述、实验设计、数据分析和论文撰写,大幅提升科研效率
- Google DeepMind 与北卡罗来纳大学合作实现 AI 对人类第一视角视觉的理解:该研究成果发表于 arXiv,为 AI 理解人类行为和意图提供了新的思路
|
|