先把文章收全,再把阅读路线设计成讨论。这里覆盖 anthropic.com 与 claude.com,不只博客,也包括 Engineering、Research、News 中的技术文章。
用 sitemap 做底,再按路径和关键词筛选:避免只看 anthropic.com/blog,也避免漏掉 claude.com/blog 上的 Claude Code 实践文章。
24 篇。Agent、harness、MCP、Claude Code、eval、context engineering,是研讨主干。
120 篇。Interpretability、alignment、model behavior、安全与社会影响。
92 篇。Claude Code、大上下文、企业/团队实践、产品工作流。
88 篇。模型发布、system card、安全、API、应用报告。
研讨不需要读完 324 篇。建议先用 27 篇建立主线:Agent 架构 → Claude Code → Context/Eval → Interpretability/Safety → 组织影响。
Managed Agents 架构
大脑/手/session 解耦,meta-harness 的核心架构文章
高级工具使用
Claude Developer Platform 的工具调用能力演进
Claude Code 安全
sandboxing 如何让 Claude Code 更安全、更自主
Claude Code 最佳实践
Claude Code 使用策略、配置、并行 session、workflow
大型代码库
claude.com 上的大型代码库实践,不在 anthropic.com
1M context / Session management
1M context 从 preview 到 GA 的使用边界
Mechanistic interpretability
解释性研究主线入口
目标不是“读文章汇报”,而是把 Anthropic 的工程思想转成你们自己的 agent / 产品 / 组织方法论。
两种模式:半天速读适合探索;四周 reading group 适合沉淀为团队方法论。
3.5 小时:30 分钟导读 + 4 个主题站点轮转 + 45 分钟收敛。适合快速建立共识。
每周 90 分钟,每次 4–6 篇。会前异步读,现场只讨论“可迁移到我们的问题”。
每篇文章只回答三问:它反对什么默认假设?抽象出什么接口/机制?我们能应用在哪里?
建议最终产出不是 PPT,而是三份可执行文档:Agent 架构原则、Claude Code 团队规范、Eval & Safety checklist。
下面按主主题展示候选文章。每个分组最多展示 80 篇;完整 JSON/Markdown 已保存在本机,可继续迭代筛选。