静态归档页 · 不新增纯文本日报之外的事实

AI 日报 | 2026-05-23

今天概览:

过去 24-48 小时的 AI 新闻主线并不是单一模型发布,而是“能力、分发、基础设施、治理”同时加速:OpenAI 把通用推理模型推进到可自主解决知名数学开放问题;Google 在 I/O 后把 Gemini 3.5 Flash、Gemini Omni 和 Search agents 推向产品入口;Anthropic 则用 Project Glasswing 展示 AI 在攻防安全中的双刃剑效应。商业侧最值得关注的是算力交易和企业落地:Anthropic 与 SpaceX 的 Colossus 算力安排被严肃媒体披露为每月 12.5 亿美元级别,同时 GitHub Copilot 开始用自动模型路由和 Gemini 3.5 Flash 把多模型能力产品化。

【今日最重要的 3-5 条】

1. OpenAI 称其内部通用推理模型自主推翻离散几何中的核心猜想

摘要:OpenAI 发布研究称,一个内部通用推理模型解决了 Paul Erdős 1946 年提出的 planar unit distance problem 相关长期猜想,给出了一个无限构造族,带来多项式级改进;证明已由外部数学家检查,并有伴随评述。

关键细节:OpenAI 强调该模型不是专门为数学训练、也不是为该问题搭建搜索脚手架的专用系统;问题涉及在平面中放置 n 个点时,距离恰为 1 的点对数量上界。OpenAI 引述 Tim Gowers 等数学家的评价,称这是 AI 数学的里程碑之一。

为什么重要:这把“AI 辅助数学”推进到“通用模型提出并完成可验证新证明”的阶段。即便仍需人工验证,它对科研自动化、形式化验证工具链、AI 发现系统的投资逻辑都有直接影响。

来源标签:官方发布 / 研究

链接:https://openai.com/index/model-disproves-discrete-geometry-conjecture/

2. Anthropic Project Glasswing:Claude Mythos Preview 已发现上万高危或严重漏洞

摘要:Anthropic 在 Project Glasswing 初始更新中称,约 50 个合作伙伴使用 Claude Mythos Preview,在关键软件中发现超过 10,000 个高危或严重级漏洞;Anthropic 也用该模型扫描了 1,000 多个开源项目。

关键细节:Cloudflare 在关键路径系统中发现 2,000 个 bug,其中 400 个被评为高危或严重;Mozilla 在 Firefox 150 测试中发现并修复 271 个漏洞。Anthropic 称 Mythos Preview 在开源扫描中估计发现 6,202 个高危或严重漏洞,已由独立安全团队或 Anthropic 评估的 1,752 个高危/严重候选中,90.6% 为有效真阳性,62.4% 被确认为高危或严重。Anthropic 同时表示暂不公开发布 Mythos-class 模型,因为现有防护不足以防止严重滥用。

为什么重要:安全行业的瓶颈正在从“发现漏洞”转向“验证、披露、修补和部署”。这既强化了 AI 安全工具的商业价值,也提高了攻击者一旦获得同等级模型后的系统性风险。

来源标签:官方发布 / 安全研究

链接:https://www.anthropic.com/research/glasswing-initial-update

3. Google I/O 2026:Gemini 3.5 Flash、Gemini Omni 与 Search agents 构成新的产品分发层

摘要:Google 在 I/O 2026 汇总中宣布 Gemini 3.5 Flash、Gemini Omni、Gemini for Science 等一组更新;Search 单独更新显示 AI Mode 已超过 10 亿月活,并将 Gemini 3.5 Flash 作为全球默认模型。

关键细节:Google 称 Gemini 3.5 Flash 在 Terminal-Bench 2.1 为 76.2%、GDPval-AA 为 1656 Elo、MCP Atlas 为 83.6%,主打接近旗舰模型的智能与 Flash 系列速度;Gemini Omni 从视频生成开始,结合 Gemini 智能和生成式媒体模型,支持引用图像、文本、视频或音频生成统一输出,并带 SynthID 水印。Search agents 将先以 information agents 形态面向 Google AI Pro 和 Ultra 用户在夏季上线,可 24/7 监控网页、新闻、社交、金融、购物、体育等变化并推送综合更新。

为什么重要:Google 正在把模型能力嵌入 Search、YouTube、Gemini app、Flow、Antigravity 和科学工具链,而不是只在 API 层竞争。这对应用入口、广告/电商搜索、开发者平台和内容生成生态都有长期影响。

来源标签:官方发布 / 产品

链接:https://blog.google/innovation-and-ai/technology/ai/google-io-2026-all-our-announcements/

链接:https://blog.google/products-and-platforms/products/search/search-io-2026/

4. Anthropic 与 SpaceX 算力交易:官方确认 Colossus 1 超 300MW,严肃媒体披露每月 12.5 亿美元级别

摘要:Anthropic 此前官方宣布与 SpaceX 签署算力合作,使用 Colossus 1 数据中心全部算力;Axios 进一步报道称,Anthropic 将向 SpaceX 支付每月 12.5 亿美元,直到 2029 年 5 月。

关键细节:Anthropic 官方称 Colossus 1 将在一个月内提供超过 300MW 新容量、超过 220,000 块 NVIDIA GPU,并用于提升 Claude Pro、Claude Max 和 API 容量;Axios 称该交易折合每年约 150 亿美元,对年收入约 180 亿美元的 SpaceX 也是重大增量,并提到双方可提前 90 天通知退出。

为什么重要:前沿模型公司竞争的核心约束继续从算法扩展到电力、数据中心、GPU/加速器和长期资本承诺。对投资者而言,AI 公司利润表之外的算力负债和供应链集中度正在成为关键变量。

来源标签:官方发布 + 严肃媒体/商业新闻

链接:https://www.anthropic.com/news/higher-limits-spacex

链接:https://www.axios.com/2026/05/20/anthropic-spacex-compute

5. GitHub Copilot 多模型产品化:Gemini 3.5 Flash GA,VS Code 自动模型选择按任务路由

摘要:GitHub 宣布 Gemini 3.5 Flash 在 Copilot 中逐步 GA,同时 VS Code 的 Copilot auto model selection 会根据任务、模型健康度和利用率自动选择模型。

关键细节:Gemini 3.5 Flash 面向 Copilot Pro、Pro+、Business、Enterprise 用户,支持 VS Code、Visual Studio、JetBrains、Xcode、Eclipse;初始 premium request multiplier 为 14x。自动模型选择会考虑推理、代码生成复杂度、bug 诊断难度和工具编排需求,当前只路由到 0x-1x multiplier 模型,并给付费用户 10% multiplier 折扣。

为什么重要:开发者工具正在从“让用户选模型”转向“系统按任务和成本自动调度模型”。这会影响模型供应商在 IDE 场景中的分发权、定价权和可观测性。

来源标签:GitHub changelog / 产品

链接:https://github.blog/changelog/2026-05-19-gemini-3-5-flash-is-generally-available-for-github-copilot/

链接:https://github.blog/changelog/2026-05-20-auto-model-selection-now-routes-based-on-your-task-in-vs-code/

【信号观察】

【延伸阅读】

1. OpenAI:An OpenAI model has disproved a central conjecture in discrete geometry

https://openai.com/index/model-disproves-discrete-geometry-conjecture/

2. Anthropic:Project Glasswing: An initial update

https://www.anthropic.com/research/glasswing-initial-update

3. Google:100 things we announced at I/O 2026

https://blog.google/innovation-and-ai/technology/ai/google-io-2026-all-our-announcements/

4. Google:A new era for AI Search

https://blog.google/products-and-platforms/products/search/search-io-2026/

5. GitHub:Gemini 3.5 Flash is generally available for GitHub Copilot

https://github.blog/changelog/2026-05-19-gemini-3-5-flash-is-generally-available-for-github-copilot/

6. Axios:Two hours that changed AI

https://www.axios.com/2026/05/21/ai-news-cycle-openai-anthropic-spacex

【说明】

本日报只保留有来源支撑的信息;官方发布优先,商业交易与资本市场信息使用 Axios、WSJ/Reuters 等严肃媒体信号并明确标注来源类型。对于尚未由官方或高可信媒体确认的传闻、二次转载和无法核验的融资/IPO 说法,未纳入正文。