AI 日报

今日 AI 要览

2026-04-22 编码代理规模化 · RL 训练效率 · 供应链安全 3 条精选 · 6 条延伸
今日概览

过去 48 小时里,真正值得保留的一手 AI 更新不算多,高信号主要集中在三条线上:企业级编码代理的快速扩张、代理式开发带来的新型安全风险,以及面向 RL / 边缘部署的基础设施效率优化。和前一阶段「发新模型」不同,今天更值得关注的是——AI 系统如何进入真实生产环境并稳定跑起来

今日精选
1

OpenAI 扩大 Codex 企业落地,推出 Codex Labs 并联合六大全球系统集成商

OpenAI 宣布推出 Codex Labs,并与 Accenture、Capgemini、Cognizant、Infosys、PwC、TCS 等合作,把 Codex 从团队试点推进到大规模企业部署。同时披露,Codex 周活开发者已从月初的 300 万增至 400 万以上。

为什么重要

「编码代理」正在从个人提效工具转向企业级交付体系——接下来竞争重点会从模型能力本身,转到培训、流程嵌入、合规与交付网络。

2

NVIDIA 公开 RL 训练端到端 FP8 方案:精度接近 BF16,吞吐最高提升约 48%

NVIDIA 在 NeMo RL 中披露端到端 FP8 训练方案:在线性层使用 FP8,并通过 importance sampling 等方法缩小训练 / 生成数值偏差;Llama 3.1 8B 与 Qwen3 系列实验显示,线性层端到端 FP8 可带来 15% 以上吞吐提升,进一步将 KV cache 与 attention 也切至 FP8 后,整体 rollout 相比 BF16 可达约 48% 加速。

为什么重要

推理时代之后,RL 成本正在成为下一轮模型迭代的瓶颈。谁先把 RL 训练效率做上去,谁就更可能在「更长推理链、更高训练频次」的竞赛里占优。

3

NVIDIA AI Red Team 披露 AGENTS.md 间接注入攻击路径,直指代理式开发供应链风险

NVIDIA 公开了一条面向代理开发环境的攻击链:恶意依赖在构建阶段写入 AGENTS.md,通过项目级指令重定义代理行为,并尝试在 PR 摘要中隐藏恶意修改。案例以 Codex 为例,展示了「供应链投毒 + 配置指令劫持 + 摘要隐藏」如何串联成一个完整攻击面。

为什么重要

这不是传统 prompt injection 的翻版,而是把代理系统、代码仓库配置、CI/CD 与依赖供应链连成了一个新攻击面;随着编码代理进入生产,这类风险会迅速从研究问题变成工程治理问题。

延伸阅读
说明 · 方法论
仅保留有官方或原始来源支撑的信息;缺乏足够来源支撑的内容已省略。
若按「过去 48 小时、且必须有一手来源」严格筛选,今天的高置信更新确实偏少,因此本期重点仅保留 3 条。