静态归档页 · 不新增纯文本日报之外的事实

AI 日报 | 2026-05-23

今天概览：

过去 24-48 小时的 AI 新闻主线并不是单一模型发布，而是“能力、分发、基础设施、治理”同时加速：OpenAI 把通用推理模型推进到可自主解决知名数学开放问题；Google 在 I/O 后把 Gemini 3.5 Flash、Gemini Omni 和 Search agents 推向产品入口；Anthropic 则用 Project Glasswing 展示 AI 在攻防安全中的双刃剑效应。商业侧最值得关注的是算力交易和企业落地：Anthropic 与 SpaceX 的 Colossus 算力安排被严肃媒体披露为每月 12.5 亿美元级别，同时 GitHub Copilot 开始用自动模型路由和 Gemini 3.5 Flash 把多模型能力产品化。

【今日最重要的 3-5 条】

1. OpenAI 称其内部通用推理模型自主推翻离散几何中的核心猜想

摘要：OpenAI 发布研究称，一个内部通用推理模型解决了 Paul Erdős 1946 年提出的 planar unit distance problem 相关长期猜想，给出了一个无限构造族，带来多项式级改进；证明已由外部数学家检查，并有伴随评述。

关键细节：OpenAI 强调该模型不是专门为数学训练、也不是为该问题搭建搜索脚手架的专用系统；问题涉及在平面中放置 n 个点时，距离恰为 1 的点对数量上界。OpenAI 引述 Tim Gowers 等数学家的评价，称这是 AI 数学的里程碑之一。

为什么重要：这把“AI 辅助数学”推进到“通用模型提出并完成可验证新证明”的阶段。即便仍需人工验证，它对科研自动化、形式化验证工具链、AI 发现系统的投资逻辑都有直接影响。

来源标签：官方发布 / 研究

链接：https://openai.com/index/model-disproves-discrete-geometry-conjecture/

2. Anthropic Project Glasswing：Claude Mythos Preview 已发现上万高危或严重漏洞

摘要：Anthropic 在 Project Glasswing 初始更新中称，约 50 个合作伙伴使用 Claude Mythos Preview，在关键软件中发现超过 10,000 个高危或严重级漏洞；Anthropic 也用该模型扫描了 1,000 多个开源项目。

关键细节：Cloudflare 在关键路径系统中发现 2,000 个 bug，其中 400 个被评为高危或严重；Mozilla 在 Firefox 150 测试中发现并修复 271 个漏洞。Anthropic 称 Mythos Preview 在开源扫描中估计发现 6,202 个高危或严重漏洞，已由独立安全团队或 Anthropic 评估的 1,752 个高危/严重候选中，90.6% 为有效真阳性，62.4% 被确认为高危或严重。Anthropic 同时表示暂不公开发布 Mythos-class 模型，因为现有防护不足以防止严重滥用。

为什么重要：安全行业的瓶颈正在从“发现漏洞”转向“验证、披露、修补和部署”。这既强化了 AI 安全工具的商业价值，也提高了攻击者一旦获得同等级模型后的系统性风险。

来源标签：官方发布 / 安全研究

链接：https://www.anthropic.com/research/glasswing-initial-update

3. Google I/O 2026：Gemini 3.5 Flash、Gemini Omni 与 Search agents 构成新的产品分发层

摘要：Google 在 I/O 2026 汇总中宣布 Gemini 3.5 Flash、Gemini Omni、Gemini for Science 等一组更新；Search 单独更新显示 AI Mode 已超过 10 亿月活，并将 Gemini 3.5 Flash 作为全球默认模型。

关键细节：Google 称 Gemini 3.5 Flash 在 Terminal-Bench 2.1 为 76.2%、GDPval-AA 为 1656 Elo、MCP Atlas 为 83.6%，主打接近旗舰模型的智能与 Flash 系列速度；Gemini Omni 从视频生成开始，结合 Gemini 智能和生成式媒体模型，支持引用图像、文本、视频或音频生成统一输出，并带 SynthID 水印。Search agents 将先以 information agents 形态面向 Google AI Pro 和 Ultra 用户在夏季上线，可 24/7 监控网页、新闻、社交、金融、购物、体育等变化并推送综合更新。

为什么重要：Google 正在把模型能力嵌入 Search、YouTube、Gemini app、Flow、Antigravity 和科学工具链，而不是只在 API 层竞争。这对应用入口、广告/电商搜索、开发者平台和内容生成生态都有长期影响。

来源标签：官方发布 / 产品

链接：https://blog.google/innovation-and-ai/technology/ai/google-io-2026-all-our-announcements/

链接：https://blog.google/products-and-platforms/products/search/search-io-2026/

4. Anthropic 与 SpaceX 算力交易：官方确认 Colossus 1 超 300MW，严肃媒体披露每月 12.5 亿美元级别

摘要：Anthropic 此前官方宣布与 SpaceX 签署算力合作，使用 Colossus 1 数据中心全部算力；Axios 进一步报道称，Anthropic 将向 SpaceX 支付每月 12.5 亿美元，直到 2029 年 5 月。

关键细节：Anthropic 官方称 Colossus 1 将在一个月内提供超过 300MW 新容量、超过 220,000 块 NVIDIA GPU，并用于提升 Claude Pro、Claude Max 和 API 容量；Axios 称该交易折合每年约 150 亿美元，对年收入约 180 亿美元的 SpaceX 也是重大增量，并提到双方可提前 90 天通知退出。

为什么重要：前沿模型公司竞争的核心约束继续从算法扩展到电力、数据中心、GPU/加速器和长期资本承诺。对投资者而言，AI 公司利润表之外的算力负债和供应链集中度正在成为关键变量。

来源标签：官方发布 + 严肃媒体/商业新闻

链接：https://www.anthropic.com/news/higher-limits-spacex

链接：https://www.axios.com/2026/05/20/anthropic-spacex-compute

5. GitHub Copilot 多模型产品化：Gemini 3.5 Flash GA，VS Code 自动模型选择按任务路由

摘要：GitHub 宣布 Gemini 3.5 Flash 在 Copilot 中逐步 GA，同时 VS Code 的 Copilot auto model selection 会根据任务、模型健康度和利用率自动选择模型。

关键细节：Gemini 3.5 Flash 面向 Copilot Pro、Pro+、Business、Enterprise 用户，支持 VS Code、Visual Studio、JetBrains、Xcode、Eclipse；初始 premium request multiplier 为 14x。自动模型选择会考虑推理、代码生成复杂度、bug 诊断难度和工具编排需求，当前只路由到 0x-1x multiplier 模型，并给付费用户 10% multiplier 折扣。

为什么重要：开发者工具正在从“让用户选模型”转向“系统按任务和成本自动调度模型”。这会影响模型供应商在 IDE 场景中的分发权、定价权和可观测性。

来源标签：GitHub changelog / 产品

链接：https://github.blog/changelog/2026-05-19-gemini-3-5-flash-is-generally-available-for-github-copilot/

链接：https://github.blog/changelog/2026-05-20-auto-model-selection-now-routes-based-on-your-task-in-vs-code/

【信号观察】

- Anthropic 收购 Stainless，强化 SDK、CLI 与 MCP server tooling。Stainless 自 2022 年起为 Anthropic 生成官方 SDK，覆盖 TypeScript、Python、Go、Java 等；这说明 agent connectivity 正从协议叙事进入开发者体验和工具链整合。来源：https://www.anthropic.com/news/anthropic-acquires-stainless

- Google 把 SynthID 验证扩展到 Gemini app、Search 和 Chrome，并称 OpenAI、Kakao、ElevenLabs 等会把 SynthID 用到更多 AI 生成内容中。内容来源验证正在从政策声明变成产品层默认能力。来源：https://blog.google/innovation-and-ai/technology/ai/google-io-2026-all-our-announcements/

- Gemini for Science 发布 Hypothesis Generation、Computational Discovery、Literature Insights，并提供 Science Skills，整合 UniProt、AlphaFold Database、AlphaGenome API、InterPro 等 30 多个生命科学数据库和工具。科学 agent 的价值点正从“读论文”扩展到假设生成、代码变体搜索和工作流执行。来源：https://blog.google/innovation-and-ai/technology/ai/google-io-2026-all-our-announcements/

- Axios 将 OpenAI 数学突破、Anthropic 收入/算力、Nvidia 数据中心收入、SpaceX IPO 和美国 AI 行政令放在同一新闻周期解读，说明 AI 已同时成为科研、资本市场、基础设施和政策议题。来源：https://www.axios.com/2026/05/21/ai-news-cycle-openai-anthropic-spacex

【延伸阅读】

1. OpenAI：An OpenAI model has disproved a central conjecture in discrete geometry

https://openai.com/index/model-disproves-discrete-geometry-conjecture/

【说明】

本日报只保留有来源支撑的信息；官方发布优先，商业交易与资本市场信息使用 Axios、WSJ/Reuters 等严肃媒体信号并明确标注来源类型。对于尚未由官方或高可信媒体确认的传闻、二次转载和无法核验的融资/IPO 说法，未纳入正文。

AI 日报 | 2026-05-23

【今日最重要的 3-5 条】

1. OpenAI 称其内部通用推理模型自主推翻离散几何中的核心猜想

2. Anthropic Project Glasswing：Claude Mythos Preview 已发现上万高危或严重漏洞

3. Google I/O 2026：Gemini 3.5 Flash、Gemini Omni 与 Search agents 构成新的产品分发层

4. Anthropic 与 SpaceX 算力交易：官方确认 Colossus 1 超 300MW，严肃媒体披露每月 12.5 亿美元级别

5. GitHub Copilot 多模型产品化：Gemini 3.5 Flash GA，VS Code 自动模型选择按任务路由

【信号观察】

【延伸阅读】

1. OpenAI：An OpenAI model has disproved a central conjecture in discrete geometry

2. Anthropic：Project Glasswing: An initial update

3. Google：100 things we announced at I/O 2026

4. Google：A new era for AI Search

5. GitHub：Gemini 3.5 Flash is generally available for GitHub Copilot

6. Axios：Two hours that changed AI

【说明】