AI 日报 | 2026-07-04

今日概览

过去 24–48 小时没有单一“震撼发布”主导叙事，但工程化信号密集：coding agent 从个人效率工具走向企业治理，Agent runtime 抽象继续收敛，中国模型继续把长上下文和长时程编码作为突破口。

GitHub Copilot 连续更新：Vision GA、Agent session streaming 公测、Gemini 旧模型下线计划。
Google Genkit 推出 Agents API 预览，封装多轮对话、工具循环、流式输出、持久化和前端协议。
Z.AI GLM-5.1/5.2 强调 8 小时连续任务、最高 1M context 与 reasoning_effort。
Qwen3.6 仓库显示通义继续把稳定性、真实开发体验和 coding utility 作为模型重点。
NVIDIA 与 Palantir 把 Nemotron open models 放进美国政府/关键基础设施的封闭部署叙事。
vLLM、MCP 生态继续围绕新模型 serving 与协议版本治理推进。

最重要 5 条

1. GitHub Copilot Vision GA：多模态进入 coding 工作流常态

摘要GitHub 7 月 1 日宣布 Copilot vision generally available，开发者可在 Copilot Chat 中直接附加图片和 PDF，让模型把视觉材料与代码上下文一起推理。

关键细节支持 JPEG、PNG、GIF、WebP 与 PDF；覆盖 VS Code Copilot Chat、github.com Copilot Chat、Copilot CLI 等；VS Code 中可粘贴、拖放或右键附加图片，并用于 ask、plan、agent modes。

为什么重要AI coding 的输入不再局限于 repo 和文本 issue。UI 截图、架构图、报错截图、PDF spec 可以成为 agent 规划和修改代码的第一类上下文。

来源GitHub Changelog

2. Copilot Agent Session Streaming 公测：企业要求 agent 过程级审计

摘要GitHub 7 月 2 日为 GitHub Enterprise Cloud 企业托管用户开放 Copilot agent session data streaming 公测。

关键细节覆盖 github.com cloud agents、ghe.com data resident deployments、Copilot CLI、VS Code、Visual Studio 及 JetBrains/Eclipse 等 IDE；企业可通过 streaming endpoint 或 REST API 获取 prompts、responses、tool calls 等活动。

为什么重要AI coding agent 的治理对象从“结果代码”扩展到“过程轨迹”。对高合规企业，追踪 tool calls、prompt、响应和跨客户端行为，是把 agent 放进生产工程体系的前提。

来源GitHub Changelog

3. Google Genkit Agents API 预览：全栈 Agent 框架进入抽象收敛期

摘要Google Developers Blog 7 月 1 日发布 Genkit Agents API 预览，定位为构建 conversational AI 和 agentic full-stack apps 的基础接口。

关键细节Genkit 支持 TypeScript、Go、Dart、Python。Agents API 把 message history、tool loop、streaming、persistence、frontend protocol 等重复 plumbing 封装到一个 interface；开发者在 server 定义 agent，再用同一 chat() API 驱动本地进程或 HTTP endpoint。

为什么重要agent 应用复杂度越来越集中在状态、工具、流式交互、前端协同和部署。Genkit 的方向与 LangGraph、MCP、OpenAI Responses/Agents 等生态类似：把 runtime 胶水层产品化。

来源Google Developers Blog

4. Z.AI GLM-5.x：长时程 coding agent 成中国模型主战场

摘要Z.AI 文档显示，GLM-5.1 面向 long-horizon tasks，可在单个任务上连续自主工作最长 8 小时；Quick Start 同时标注 GLM-5.2 为其最强 coding model，支持最高 1M context 与 reasoning_effort。

关键细节GLM-5.1 强调 planning、execution 到 iterative optimization 的完整闭环，并在 general/coding capability 上对齐 Claude Opus 4.6；GLM-5.2 面向 coding 场景，文档列出 1M context 和可控 reasoning depth。

为什么重要中国模型竞争从单轮 benchmark 转向“长上下文 + 工具调用 + 持续执行 + coding agent 适配”。这也是国内模型进入 Claude Code、Cline、OpenCode、OpenClaw 等工作流的关键卖点。

来源Z.AI GLM-5.1；Z.AI Quick Start

5. NVIDIA + Palantir：Nemotron open models 进入美国政府封闭环境

摘要NVIDIA 6 月 29 日称 Palantir 的新 intelligent engine 使用 NVIDIA Nemotron open models，为美国政府机构和关键基础设施运营商提供 mission-specific sovereign AI。

关键细节NVIDIA 将合作放在“open models, closed environments”框架下：开放模型可在受控、安全、主权环境中部署；Palantir 负责面向政府任务场景的引擎与工作流集成；Nemotron open models 与 NVIDIA AI Enterprise 生态形成部署基础。

为什么重要开放模型的企业价值不只是本地可跑，而是能进入对数据驻留、安全审计和任务定制要求极高的政企环境。这是开放权重模型从开发者采用走向关键基础设施部署的信号。

来源NVIDIA Blog

其他值得关注

GitHub 将在 Copilot 中下线 Gemini 2.5 Pro 与 Gemini 3 Flash

GitHub 7 月 2 日宣布，Gemini 2.5 Pro 与 Gemini 3 Flash 将在 2026-07-31 从所有 Copilot experiences 中下线，包括 Copilot Chat、inline edits、ask/agent modes 与 code completions。建议替代模型分别为 Gemini 3.1 Pro 与 Gemini 3.5 Flash。

来源GitHub Changelog

Qwen3.6 仓库出现：通义继续强调 coding 真实可用性

QwenLM/Qwen3.6 GitHub 仓库介绍称，Qwen3.6 在 Qwen3.5 基础上优先强调 stability 与 real-world utility，并把更直观、响应更快、真正高效的 coding experience 作为重点。

来源QwenLM/Qwen3.6

vLLM 对 DeepSeek-V4 的后端硬化仍在继续

vLLM release 列表显示，近期版本包含来自 200 位贡献者的 408 个 commits，并提到 DeepSeek-V4 在 v0.22.0 引入后继续获得大规模 hardening 与 optimization pass。

来源vLLM releases

MCP SDK 进入 v2/spec 迁移窗口

Model Context Protocol Python SDK 与 TypeScript SDK 的公开信息显示，v2 正在预发布/迁移阶段，稳定版目标与 2026-07-28 spec release 对齐；Python SDK release 描述提到 LATEST_PROTOCOL_VERSION 为 2026-07-28，并引入 mcp-types 分发。

来源MCP Python SDK；MCP TypeScript SDK

中国 AI 生态观察

过去 48 小时最明确的中国生态信号来自 Z.AI 与 Qwen：前者围绕 GLM-5.x 把长时程 coding agent、1M context 和 reasoning_effort 明确产品化；后者在 Qwen3.6 上继续强化稳定性与真实编码体验。DeepSeek、Kimi、豆包、文心、MiniMax 在本轮检索中未发现同等可信的 24–48 小时官方重大发布；因此本期不把中文媒体或聚合站传闻列为重点条目。

AI 日报 | 2026-07-04

今日概览

最重要 5 条

1. GitHub Copilot Vision GA：多模态进入 coding 工作流常态

2. Copilot Agent Session Streaming 公测：企业要求 agent 过程级审计

3. Google Genkit Agents API 预览：全栈 Agent 框架进入抽象收敛期

4. Z.AI GLM-5.x：长时程 coding agent 成中国模型主战场

5. NVIDIA + Palantir：Nemotron open models 进入美国政府封闭环境

其他值得关注

GitHub 将在 Copilot 中下线 Gemini 2.5 Pro 与 Gemini 3 Flash

Qwen3.6 仓库出现：通义继续强调 coding 真实可用性

vLLM 对 DeepSeek-V4 的后端硬化仍在继续

MCP SDK 进入 v2/spec 迁移窗口

中国 AI 生态观察

来源链接