AI 日报 | 2026-06-06

今天概览：过去 24-48 小时内，AI 主线不在“单一闭源前沿模型突袭”，而在开源/开放权重模型继续向 Agent、长上下文、物理世界建模推进。NVIDIA、MiniMax、GitHub Copilot 等更新都指向同一个方向：模型不再只是回答器，而是长时间执行、调用工具、操作界面、生成可验证工作产物的系统组件。商业侧值得关注的是 Anthropic 已向 SEC 秘密提交 S-1 草案，AI 基础模型公司进入资本市场通道的信号进一步明确；政策侧，美国白宫也发布了面向高级 AI 创新与安全的行政令。

【今日最重要的 5 条】

1. MiniMax M3 发布：开放权重模型把 1M 上下文、原生多模态和 Agentic Coding 打包到一起
摘要：MiniMax 官方发布 MiniMax M3，定位为面向编码、Agent 和长上下文任务的开放权重模型。官方称 M3 使用 MiniMax Sparse Attention（MSA），支持最高 100 万 token 上下文，原生支持图像/视频输入，并可操作桌面计算机。
关键细节：MiniMax 称 M3 在 SWE-Bench Pro 上超过 GPT-5.5 与 Gemini 3.1 Pro、接近 Opus 4.7；在 SVG-Bench 上超过 Opus 4.7；在 OmniDocBench 上超过 Gemini 3.1 Pro；在 Claw-Eval 端到端自主 Agent 评测中取得最高分。MSA 通过更精细的 KV block 选择降低长上下文计算成本，官方称在 100 万上下文下每 token 计算量约为上一代的 1/20，prefill 加速超过 9 倍、decode 加速超过 15 倍。
为什么重要：这是一条中国 AI 生态与开源模型发布的交叉信号：国内大模型厂商不只在聊天能力上追赶，而是直接把竞争点放在开放权重、工程任务、长上下文、多模态和桌面操作 Agent 上。如果权重与技术报告按计划充分开放，M3 会成为开发者评估开放 Agent 模型的重要基准之一。
来源标签：公司官方 / 中国 AI / 开放权重模型
链接：https://www.minimax.io/blog/minimax-m3

2. NVIDIA Nemotron 3 Ultra 与 Cosmos 3：开放模型覆盖长程 Agent 与物理 AI
摘要：NVIDIA 在 GTC Taipei / COMPUTEX 期间发布 Nemotron 3 Ultra，并在 Hugging Face 推出 Cosmos 3。前者面向长时间运行的企业 Agent，后者定位为用于物理 AI 推理与动作生成的开放 omni-model。
关键细节：NVIDIA 官方称 Nemotron 3 Ultra 是 550B 参数开放模型，用于长程 Agent 中的规划、工具调用、结果评估和多轮迭代，复杂 Agent 任务推理最高快 5 倍、成本最高降低 30%。Cosmos 3 则基于 Mixture-of-Transformers 架构，将世界生成、物理推理与动作生成统一到一个模型；发布包含 Cosmos 3 Super 与 Cosmos 3 Nano、Diffusers 集成、后训练脚本和物理 AI 合成数据集。
为什么重要：NVIDIA 正把“GPU 平台公司”进一步扩展为“模型 + 工具链 + 数据生成 + 推理部署”平台。Nemotron 3 Ultra 争夺企业 Agent 工作流入口，Cosmos 3 则服务机器人、自动驾驶、智能空间等物理 AI 场景，强化其从数据中心到边缘/机器人生态的闭环。
来源标签：公司官方 / AI 芯片与算力生态 / 开源模型
链接：https://blogs.nvidia.com/blog/nvidia-gtc-taipei-computex-2026-news/ ；https://huggingface.co/blog/nvidia/cosmos-3-for-physical-ai

3. GitHub Copilot App 技术预览扩大开放：Agentic Coding 从聊天转向“可视化工作面”
摘要：GitHub 宣布 Copilot App 技术预览向现有 Copilot Pro、Pro+、Business、Enterprise 用户开放，并加入 canvases、云端 Agent 会话、定时自动化、Copilot CLI 会话同步等能力。
关键细节：Copilot App 允许用户从 issue、PR、prompt 或历史会话启动 Agent session，在独立 git worktree 和 branch 中并行运行；用户可审查 plan 和 diff，在集成终端与浏览器中验证行为，再发起 PR。新增 canvases 被定义为人和 Agent 共享的结构化工作面，可承载计划、PR、浏览器会话、终端、发布清单、迁移看板等对象，Agent 可更新 canvas，用户可编辑、重排、批准或纠偏。
为什么重要：Agentic Coding 的瓶颈正在从“模型会不会写代码”转向“人如何监督、验证、合并 Agent 的持续工作”。GitHub 把 Agent 输出从聊天记录迁移到可检查、可操作、可验证的工作对象，说明开发工具竞争正在进入 AX（agent experience）层。
来源标签：官方 changelog / 开发者工具 / Agentic Coding
链接：https://github.blog/changelog/2026-06-02-expanded-technical-preview-availability-for-the-github-copilot-app/

4. Anthropic 秘密提交 S-1 草案：Claude 公司保留 IPO 选项
摘要：Anthropic 官方宣布已向美国 SEC 秘密提交 Form S-1 注册声明草案，为潜在普通股 IPO 做准备。公司强调是否上市取决于 SEC 审查、市场条件和其他因素，发行股数与价格尚未确定。
关键细节：这是基础模型公司商业化进入资本市场通道的明确信号。Anthropic 近期同时在推进 Claude Partner Network、Project Glasswing、AI-enabled cyber threats 报告等企业与安全侧动作，S-1 草案意味着其可能需要用公开市场资本继续支撑模型训练、推理基础设施和企业渠道扩张。
为什么重要：AI 基础模型公司的资本开支和收入增长都高度前置，IPO 选项将使外界更接近观察 Claude 业务的真实收入结构、毛利、推理成本、客户集中度和云/算力承诺。它也会影响 OpenAI、xAI、Mistral、国内大模型公司等同类公司的融资与退出预期。
来源标签：公司官方 / AI 商业事件
链接：https://www.anthropic.com/news/confidential-draft-s1-sec

5. 白宫发布高级 AI 创新与安全行政令：美国继续把 AI、网络防御和国家安全绑定
摘要：美国白宫发布《Promoting Advanced Artificial Intelligence Innovation and Security》行政令，政策目标是促进 AI 创新与安全，并要求政府部门围绕国家安全系统、国防信息系统、民用联邦系统的网络防御采取行动。
关键细节：行政令要求相关机构在 30 天内优先推进国家安全系统、国防信息系统和民用联邦政府信息系统的网络防御；同时强调与私营部门合作，现代化政府和私营部门信息系统、防止美国知识产权被对手利用和窃取、培养高级 AI-enabled capabilities。
为什么重要：美国 AI 政策正在从“模型安全评估”进一步扩展到“AI + 网络防御 + 政府系统现代化 + IP 保护”的国家安全框架。这会影响大模型厂商、云厂商、网络安全公司和政府承包商的合规与采购机会。
来源标签：政府官方 / 政策与安全
链接：https://www.whitehouse.gov/presidential-actions/2026/06/promoting-advanced-artificial-intelligence-innovation-and-security/

【信号观察】

1. 智谱官方文档显示 GLM 系列继续强化长程 Coding Agent 与多模态工具调用：新品发布页列出 GLM-5V-Turbo 多模态 Coding 基座、AutoGLM-Phone、Web Search API / Search Agent 等更新，并强调长程任务、GUI Agent、截图/读网页等多模态 tools。来源：https://docs.bigmodel.cn/cn/update/new-releases

2. Google 与 Kaggle 重启五日 AI Agents Intensive / Vibe Coding 课程，覆盖自然语言工作流、工具/API 集成和 capstone 项目。信号在于，大厂正在把 Agent 构建能力从研究/平台团队扩散到更广泛开发者群体。来源：https://blog.google/innovation-and-ai/technology/developers-tools/kaggle-genai-intensive-course-vibe-coding-june-2026/

3. SemiEngineering 关注 Groq 的 SRAM-based LLM inference deployment：论文回顾 Groq 公有云 SHIP 架构，强调用 SRAM 和低延迟大规模同步互联缓解 GPU/HBM decode 阶段的内存带宽瓶颈。算力竞争不只发生在 GPU 型号上，也发生在推理系统架构与内存层级设计上。来源：https://semiengineering.com/large-scale-sram-based-llm-inference-deployment-groq/

4. Hugging Face 博客近期高频出现物理 AI、Agent RL、ZeroGPU、LeRobot Humanoid、Nemotron 安全等主题，说明开源生态的注意力正从“单模型聊天”转向机器人、世界模型、Agent 基础设施和低成本部署。来源：https://huggingface.co/blog

【延伸阅读】

1. MiniMax M3 官方发布：Frontier Coding, 1M Context, Native Multimodality — All in One Model
https://www.minimax.io/blog/minimax-m3

2. NVIDIA GTC Taipei / COMPUTEX 实时更新：Nemotron 3 Ultra、Physical AI、Agentic AI 等
https://blogs.nvidia.com/blog/nvidia-gtc-taipei-computex-2026-news/

3. Hugging Face：Welcome NVIDIA Cosmos 3: The First Open Omni-model for Physical AI Reasoning and Action
https://huggingface.co/blog/nvidia/cosmos-3-for-physical-ai

4. GitHub Changelog：Expanded technical preview availability for the GitHub Copilot app
https://github.blog/changelog/2026-06-02-expanded-technical-preview-availability-for-the-github-copilot-app/

5. Anthropic：Confidentially submits draft S-1 to the SEC
https://www.anthropic.com/news/confidential-draft-s1-sec

6. White House：Promoting Advanced Artificial Intelligence Innovation and Security
https://www.whitehouse.gov/presidential-actions/2026/06/promoting-advanced-artificial-intelligence-innovation-and-security/

【说明】
本日报只保留有官方来源、公司博客、GitHub/Hugging Face 页面、政府公告或严肃技术媒体支撑的信息；未能追溯到可靠来源的传闻未纳入。今天主动检查了：中国 AI 生态（机器之心、量子位、DeepSeek、Qwen、智谱、Kimi、豆包、百度文心等关键词与官方入口）、AI 芯片/算力（NVIDIA Blog、SemiEngineering、Groq/数据中心推理相关）、开源模型发布（Hugging Face、Qwen/DeepSeek/Mistral GitHub releases、MiniMax 官方）、AI 商业事件（AI funding/acquisition/investment、Anthropic 官方 S-1、Alphabet/Reuters/SEC 相关线索）。部分网页抽取工具对若干站点返回拦截，因此对可访问页面使用了浏览器/本地 HTTP 抓取进行核验。