AI 日报 · 2026-04-22

今日概览

过去 48 小时里，真正值得保留的一手 AI 更新不算多，高信号主要集中在三条线上：企业级编码代理的快速扩张、代理式开发带来的新型安全风险，以及面向 RL / 边缘部署的基础设施效率优化。和前一阶段「发新模型」不同，今天更值得关注的是——AI 系统如何进入真实生产环境并稳定跑起来。

今日精选

OpenAI 扩大 Codex 企业落地，推出 Codex Labs 并联合六大全球系统集成商

OpenAI 宣布推出 Codex Labs，并与 Accenture、Capgemini、Cognizant、Infosys、PwC、TCS 等合作，把 Codex 从团队试点推进到大规模企业部署。同时披露，Codex 周活开发者已从月初的 300 万增至 400 万以上。

为什么重要

「编码代理」正在从个人提效工具转向企业级交付体系——接下来竞争重点会从模型能力本身，转到培训、流程嵌入、合规与交付网络。

官方来源阅读原文

NVIDIA 公开 RL 训练端到端 FP8 方案：精度接近 BF16，吞吐最高提升约 48%

NVIDIA 在 NeMo RL 中披露端到端 FP8 训练方案：在线性层使用 FP8，并通过 importance sampling 等方法缩小训练 / 生成数值偏差；Llama 3.1 8B 与 Qwen3 系列实验显示，线性层端到端 FP8 可带来 15% 以上吞吐提升，进一步将 KV cache 与 attention 也切至 FP8 后，整体 rollout 相比 BF16 可达约 48% 加速。

为什么重要

推理时代之后，RL 成本正在成为下一轮模型迭代的瓶颈。谁先把 RL 训练效率做上去，谁就更可能在「更长推理链、更高训练频次」的竞赛里占优。

官方来源阅读原文

NVIDIA AI Red Team 披露 AGENTS.md 间接注入攻击路径，直指代理式开发供应链风险

NVIDIA 公开了一条面向代理开发环境的攻击链：恶意依赖在构建阶段写入 AGENTS.md，通过项目级指令重定义代理行为，并尝试在 PR 摘要中隐藏恶意修改。案例以 Codex 为例，展示了「供应链投毒 + 配置指令劫持 + 摘要隐藏」如何串联成一个完整攻击面。

为什么重要

这不是传统 prompt injection 的翻版，而是把代理系统、代码仓库配置、CI/CD 与依赖供应链连成了一个新攻击面；随着编码代理进入生产，这类风险会迅速从研究问题变成工程治理问题。

官方来源阅读原文