AI 日报 | 2026-05-02

今日概览

过去 24–48 小时的高置信更新主要集中在三条线：Copilot/ChatGPT 等 AI 工作流进入“账户安全与模型生命周期管理”阶段；多 agent 系统的风险评估从单体 agent benchmark 转向网络级传播、放大和信任捕获；NVIDIA 与 Google 继续把模型能力下沉到端侧/垂直运行时，而不是只做云端模型发布。今天没有纳入未经一手来源确认的融资传闻；商业新闻扫描中虽出现 Anthropic/Google 等投资传闻，但缺乏足够可核验的一手或高质量原文支撑，已省略。

今日最重要的 3-5 条

1) GitHub Copilot 将在 2026-06-01 下线 GPT-5.2 与 GPT-5.2-Codex

摘要：GitHub Changelog 宣布，GPT-5.2 和 GPT-5.2-Codex 将在 Copilot 体验中于 2026-06-01 弃用，GPT-5.2-Codex 在 Copilot Code Review 中例外。
关键细节：受影响范围包括 Copilot Chat、inline edits、ask/agent modes 和 code completions；建议替代模型分别为 GPT-5.5 与 GPT-5.3-Codex。Copilot Enterprise 管理员可能需要在 Copilot settings 的 model policies 中启用替代模型，并在 VS Code / github.com 的 Copilot Chat model selector 中确认可用性。
为什么重要：Copilot 的模型生命周期正在加速，企业集成和内部 agent/workflow 若硬编码模型名，需要把模型策略治理纳入发布/运维流程，而不是等到模型实际下线后补救。
来源标签：官方
链接：https://github.blog/changelog/2026-05-01-upcoming-deprecation-of-gpt-5-2-and-gpt-5-2-codex

2) Microsoft Research 发布多 agent 网络红队结果：风险出现在 agent 交互层，而非单体 agent 层

摘要：Microsoft Research 在一个包含 100+ agents 的内部 live platform 上做红队测试，观察到单条恶意消息可跨 agent 传播并逐步抽取私有数据。
关键细节：研究列出四类网络级风险：Propagation（agent worms 多跳传播并收集数据）、Amplification（借可信 agent 声誉放大伪事实）、Trust capture（劫持 agent 之间的验证方式）、Invisibility（攻击来源经由不知情 agent 链条被隐藏）。测试环境中的 agents 使用不同模型、指令和记忆，并代表不同 human principals 在论坛、私信和协作任务中互动。
为什么重要：这把 agent 安全问题从 prompt injection / tool misuse 扩展到“agent 生态系统动力学”；单 agent benchmark 很难预测网络级失败，后续平台需要做消息溯源、跨 agent 权限边界、传播抑制和 reputation/verification 机制。
来源标签：官方 / 研究
链接：https://www.microsoft.com/en-us/research/blog/red-teaming-a-network-of-agents-understanding-what-breaks-when-ai-agents-interact-at-scale/

3) OpenAI 推出 Advanced Account Security，并把高风险账户保护延伸到 Codex

摘要：OpenAI 为 ChatGPT 账户推出可选的 Advanced Account Security，把抗钓鱼登录、恢复限制、会话管理和训练排除集中到一个安全模式中，启用后也保护同一登录下的 Codex。
关键细节：该模式要求 passkeys 或实体安全密钥并禁用密码登录；禁用 email/SMS 恢复，改用 backup passkeys/security keys/recovery keys；缩短会话、提供登录提醒和 active sessions 管理；启用后对话默认不用于模型训练。OpenAI 与 Yubico 合作提供 YubiKey C Nano / YubiKey C NFC bundle；Trusted Access for Cyber 的个人成员自 2026-06-01 起需启用该安全模式，或由组织证明 SSO 已具备 phishing-resistant authentication。
为什么重要：AI 账户逐渐成为代码、工作流、个人上下文和高权限工具入口，账户接管的影响不再只是聊天记录泄露；OpenAI 正在把安全基线从“账号产品功能”提升为模型/agent 平台基础设施的一部分。
来源标签：官方
链接：https://openai.com/index/advanced-account-security

4) NVIDIA 展示用 AI agents 自动翻译 GPU kernel：cuTile Python → cuTile.jl

摘要：NVIDIA Developer Blog 介绍 TileGym 中的 skill-driven agent workflow，用于把 cuTile Python kernels 自动、可验证地迁移到 Julia 的 cuTile.jl。
关键细节：文章强调 Python 与 Julia DSL 的语义差异会导致静默错误，包括 0-based vs 1-based indexing、row-major vs column-major memory layout、broadcasting 语法、kernel API mapping、类型转换和 matrix multiply 表达方式。TileGym 将 17 条关键翻译规则、静态验证脚本和 add/matmul/softmax 示例 kernels 编码进 workflow，以支持单轮生成并验证 Julia kernels。
为什么重要：这是 agent 在系统软件/加速计算开发中的一个高价值形态：不是泛泛“写代码”，而是把有限、可枚举、可验证的跨 DSL 迁移知识产品化为工程工具，对 GPU 生态和科学计算栈迁移更实用。
来源标签：官方 / 项目原始来源
链接：https://developer.nvidia.com/blog/automating-gpu-kernel-translation-with-ai-agents-cutile-python-to-cutile-jl/

5) Gemini 进入 cars with Google built-in，面向车载场景做深度系统集成

摘要：Google 宣布 Gemini 将通过软件 rollout 进入新车和既有 cars with Google built-in，首先面向美国英语用户。
关键细节：Gemini 可自然语言处理路线/停靠点/消息等任务，并与车辆系统和 apps 集成；可基于厂商提供的 owner’s manuals 回答特定车型问题；EV 场景可查询当前电量、到达时电量、附近充电站和目的地附近设施；也可执行车内舒适性控制，例如理解“车里又冷又起雾”并调高暖风/打开除雾。未来将扩展更多语言和国家，并接入 Gmail、Calendar、Google Home 等信息。
为什么重要：这不是单纯把聊天机器人塞进车机，而是把 LLM interface 接入车况、手册、地图、通信和控制能力；对车载 OS/assistant 来说，差异化会更多来自安全边界、上下文接入深度和 OEM 数据质量。
来源标签：官方
链接：https://blog.google/products-and-platforms/platforms/android/cars-with-google-built-in-gemini-tips-2026/

信号观察

GitHub 这次给出明确弃用日期与替代模型，说明 AI coding 平台正在把“模型选择”变成企业策略项；管理员侧的 model policies 会越来越像权限、合规和成本控制的交汇点。来源：https://github.blog/changelog/2026-05-01-upcoming-deprecation-of-gpt-5-2-and-gpt-5-2-codex
Microsoft 的多 agent 红队把“单个 agent 安全”与“agent 网络安全”区分开来；后者更接近分布式系统安全，关键问题是传播、溯源、信任校验和跨 principal 隔离。来源：https://www.microsoft.com/en-us/research/blog/red-teaming-a-network-of-agents-understanding-what-breaks-when-ai-agents-interact-at-scale/
NVIDIA 同日还发布了 Unreal Engine NNE 的 TensorRT for RTX runtime 文章，强调在 RTX GPU 上通过 JIT optimizer 为本机硬件生成 inference engines，并通过 UE5 Neural Network Engine/RDG 路径服务实时图形 workload。来源：https://developer.nvidia.com/blog/speed-up-unreal-engine-nne-inference-with-nvidia-tensorrt-for-rtx-runtime/
Hugging Face 的 eval 成本文章虽略早于严格 48 小时窗口，但提供了值得跟踪的量化信号：Holistic Agent Leaderboard 约花费 40,000 美元运行 21,730 个 agent rollouts，单次 frontier model 的 GAIA run 可达 2,829 美元；agent eval 的成本、噪声和 scaffold sensitivity 正在成为模型/agent 开发瓶颈。来源：https://huggingface.co/blog/evaleval/eval-costs-bottleneck

说明

本期仅保留有官方、研究/项目原始来源或高可信来源支撑的信息。已检查官方 RSS/index、GitHub Changelog、NVIDIA Developer Blog、Microsoft Research、OpenAI News、Google Blog、Hugging Face Blog，并用 Google News RSS 做了 OpenAI、Anthropic、Google/Alphabet、Microsoft、Amazon、Meta、NVIDIA、xAI、Mistral、Cohere、Perplexity、Hugging Face 相关融资/并购/合作扫描；未能核验到足够可靠原文的传闻与转载未纳入主条目。