今日概览
过去 24–48 小时没有单一“震撼发布”主导叙事,但工程化信号密集:coding agent 从个人效率工具走向企业治理,Agent runtime 抽象继续收敛,中国模型继续把长上下文和长时程编码作为突破口。
- GitHub Copilot 连续更新:Vision GA、Agent session streaming 公测、Gemini 旧模型下线计划。
- Google Genkit 推出 Agents API 预览,封装多轮对话、工具循环、流式输出、持久化和前端协议。
- Z.AI GLM-5.1/5.2 强调 8 小时连续任务、最高 1M context 与 reasoning_effort。
- Qwen3.6 仓库显示通义继续把稳定性、真实开发体验和 coding utility 作为模型重点。
- NVIDIA 与 Palantir 把 Nemotron open models 放进美国政府/关键基础设施的封闭部署叙事。
- vLLM、MCP 生态继续围绕新模型 serving 与协议版本治理推进。
最重要 5 条
1. GitHub Copilot Vision GA:多模态进入 coding 工作流常态
摘要GitHub 7 月 1 日宣布 Copilot vision generally available,开发者可在 Copilot Chat 中直接附加图片和 PDF,让模型把视觉材料与代码上下文一起推理。
关键细节支持 JPEG、PNG、GIF、WebP 与 PDF;覆盖 VS Code Copilot Chat、github.com Copilot Chat、Copilot CLI 等;VS Code 中可粘贴、拖放或右键附加图片,并用于 ask、plan、agent modes。
为什么重要AI coding 的输入不再局限于 repo 和文本 issue。UI 截图、架构图、报错截图、PDF spec 可以成为 agent 规划和修改代码的第一类上下文。
2. Copilot Agent Session Streaming 公测:企业要求 agent 过程级审计
摘要GitHub 7 月 2 日为 GitHub Enterprise Cloud 企业托管用户开放 Copilot agent session data streaming 公测。
关键细节覆盖 github.com cloud agents、ghe.com data resident deployments、Copilot CLI、VS Code、Visual Studio 及 JetBrains/Eclipse 等 IDE;企业可通过 streaming endpoint 或 REST API 获取 prompts、responses、tool calls 等活动。
为什么重要AI coding agent 的治理对象从“结果代码”扩展到“过程轨迹”。对高合规企业,追踪 tool calls、prompt、响应和跨客户端行为,是把 agent 放进生产工程体系的前提。
3. Google Genkit Agents API 预览:全栈 Agent 框架进入抽象收敛期
摘要Google Developers Blog 7 月 1 日发布 Genkit Agents API 预览,定位为构建 conversational AI 和 agentic full-stack apps 的基础接口。
关键细节Genkit 支持 TypeScript、Go、Dart、Python。Agents API 把 message history、tool loop、streaming、persistence、frontend protocol 等重复 plumbing 封装到一个 interface;开发者在 server 定义 agent,再用同一 chat() API 驱动本地进程或 HTTP endpoint。
为什么重要agent 应用复杂度越来越集中在状态、工具、流式交互、前端协同和部署。Genkit 的方向与 LangGraph、MCP、OpenAI Responses/Agents 等生态类似:把 runtime 胶水层产品化。
4. Z.AI GLM-5.x:长时程 coding agent 成中国模型主战场
摘要Z.AI 文档显示,GLM-5.1 面向 long-horizon tasks,可在单个任务上连续自主工作最长 8 小时;Quick Start 同时标注 GLM-5.2 为其最强 coding model,支持最高 1M context 与 reasoning_effort。
关键细节GLM-5.1 强调 planning、execution 到 iterative optimization 的完整闭环,并在 general/coding capability 上对齐 Claude Opus 4.6;GLM-5.2 面向 coding 场景,文档列出 1M context 和可控 reasoning depth。
为什么重要中国模型竞争从单轮 benchmark 转向“长上下文 + 工具调用 + 持续执行 + coding agent 适配”。这也是国内模型进入 Claude Code、Cline、OpenCode、OpenClaw 等工作流的关键卖点。
5. NVIDIA + Palantir:Nemotron open models 进入美国政府封闭环境
摘要NVIDIA 6 月 29 日称 Palantir 的新 intelligent engine 使用 NVIDIA Nemotron open models,为美国政府机构和关键基础设施运营商提供 mission-specific sovereign AI。
关键细节NVIDIA 将合作放在“open models, closed environments”框架下:开放模型可在受控、安全、主权环境中部署;Palantir 负责面向政府任务场景的引擎与工作流集成;Nemotron open models 与 NVIDIA AI Enterprise 生态形成部署基础。
为什么重要开放模型的企业价值不只是本地可跑,而是能进入对数据驻留、安全审计和任务定制要求极高的政企环境。这是开放权重模型从开发者采用走向关键基础设施部署的信号。
其他值得关注
GitHub 将在 Copilot 中下线 Gemini 2.5 Pro 与 Gemini 3 Flash
GitHub 7 月 2 日宣布,Gemini 2.5 Pro 与 Gemini 3 Flash 将在 2026-07-31 从所有 Copilot experiences 中下线,包括 Copilot Chat、inline edits、ask/agent modes 与 code completions。建议替代模型分别为 Gemini 3.1 Pro 与 Gemini 3.5 Flash。
Qwen3.6 仓库出现:通义继续强调 coding 真实可用性
QwenLM/Qwen3.6 GitHub 仓库介绍称,Qwen3.6 在 Qwen3.5 基础上优先强调 stability 与 real-world utility,并把更直观、响应更快、真正高效的 coding experience 作为重点。
vLLM 对 DeepSeek-V4 的后端硬化仍在继续
vLLM release 列表显示,近期版本包含来自 200 位贡献者的 408 个 commits,并提到 DeepSeek-V4 在 v0.22.0 引入后继续获得大规模 hardening 与 optimization pass。
MCP SDK 进入 v2/spec 迁移窗口
Model Context Protocol Python SDK 与 TypeScript SDK 的公开信息显示,v2 正在预发布/迁移阶段,稳定版目标与 2026-07-28 spec release 对齐;Python SDK release 描述提到 LATEST_PROTOCOL_VERSION 为 2026-07-28,并引入 mcp-types 分发。
中国 AI 生态观察
过去 48 小时最明确的中国生态信号来自 Z.AI 与 Qwen:前者围绕 GLM-5.x 把长时程 coding agent、1M context 和 reasoning_effort 明确产品化;后者在 Qwen3.6 上继续强化稳定性与真实编码体验。DeepSeek、Kimi、豆包、文心、MiniMax 在本轮检索中未发现同等可信的 24–48 小时官方重大发布;因此本期不把中文媒体或聚合站传闻列为重点条目。
来源链接
- GitHub Changelog — Copilot vision is generally available
- GitHub Changelog — Copilot agent session streaming public preview
- GitHub Changelog — Gemini model deprecation in Copilot
- Google Developers Blog — Build agentic full-stack apps with Genkit
- NVIDIA Blog — Palantir secure AI with NVIDIA Nemotron
- Z.AI Docs — GLM-5.1
- Z.AI Docs — Quick Start / GLM-5.2
- QwenLM/Qwen3.6 GitHub
- vLLM releases
- Model Context Protocol Python SDK