🤖 AI 大模型动态 重点
🟣 OpenAI
GPT-5.5 正式发布 · 面向 Agent 的"实干型智能" 重磅
Terminal-Bench 2.0 82.7%、SWE-Bench Pro 58.6%;Token 消耗较 GPT-5.4 大幅下降,与 NVIDIA GB200 NVL72 深度共部署后单百万 Token 成本仅为前代 1/35。API 输入 $5/M、Pro 版 $30/M(翻 3 倍)。
ChatGPT Workspace Agent & 临床版上线
企业工作流 Agent 与医生专属 ChatGPT 同步推出,从 C 端向"生产力场景"全面加码。
🟧 Anthropic
Claude Code 4/23 故障复盘 技术
官方技术博客《April 23 Postmortem》罕见披露近期 Claude Code 质量波动原因,HN 热度 552 分。
Claude Opus 4.7 / Claude Design 继续主导企业市场 — Anthropic Labs 新推"Claude Design"支持一键生成设计稿、原型、PPT、单页文档。
🔵 Google DeepMind
Gemma 4 全系开源 开源
E2B / E4B / 26B-MoE / 31B-Dense 四规格,Apache 2.0 协议;31B Dense 在 Arena AI 开源榜全球第三,用不到十分之一参数对标 400B 巨无霸,端侧部署时代到来。
Gemini 3.1 Flash TTS & Gemini Robotics-ER 1.6
语音表现力再升级;具身智能推理模型强化真实机器人任务规划。
🟡 DeepSeek
V4 发布倒计时 · 1.6 万亿参数、100 万上下文 临近
普林斯顿研究员透露 V4 "下周"落地;MegaMoE 架构、384 专家每层激活 6 个、Muon 优化器 + GRPO + KL 校正、从 32K 上下文跃升到 1M,华为昇腾算力首发。
🟠 其他
Qwen3Guard 首个安全护栏模型开源(prompt + response 双向安全分类,多语言 SOTA)
Kimi K2.6 / MiniMax-W 继续在 HN 与港股保持热度 — 港股 MINIMAX-W 今日回调超 7%,兑现压力显现
Meta / Mistral / xAI 本期暂无重大动态(已监测官方渠道,无 24h 内更新)