AI Agent Trending | 2026-06-01 – 格言书丨Mottobook

【GitHub Trending】

AI/ML Agent 项目

pewdiepie-archdaemon/odysseus (7,538⭐): 自托管 AI 工作空间项目，提供完整的 AI 协作环境。
OpenBMB/PilotDeck (2,520⭐): 任务导向的 AI Agent 生产力平台，支持复杂工作流编排。
MoonshotAI/kimi-code (1,504⭐): 新一代 Agent 起点项目，月之暗面推出的 AI Agent 框架。
veryyoldman/Genspark-AI (358⭐): 开源自托管 Super Agent，Genspark.ai 的免费替代方案，支持多 Agent 协作。
mims-harvard/AutoScientists (335⭐): 自组织 Agent 团队，实现长时间科学实验自动化。

Agent 开发工具与技能生态

withkynam/vibecode-pro-max-kit (666⭐): 规范驱动的编码工具包，内置 12 个 Agent、32 项技能，解决 AI 上下文遗失问题。
sandiiarov/skill-creator (416⭐): 运行时将 MCP Server、OpenAPI 规范或 GraphQL 端点转化为 CLI 工具。
open-gsd/gsd-pi (400⭐): 强大的元提示、上下文工程和规范驱动开发系统，支持 Agent 间协作。
UditAkhourii/adhd (658⭐): 面向编码 Agent 的思维树技能，带剪枝功能。
2aronS/Duel-Agents (572⭐): 对决 Agent 的 CLI、SDK 和 IDE 插件生态。

开发者工具与基础设施

Sophomoresty/gemini-web2api (880⭐): 将 Google Gemini Web 转换为 OpenAI 兼容 API，零认证跨平台单文件方案。
0xSero/codex-shim (760⭐): 本地 Responses-API 垫片层，支持 BYOK 模型和 ChatGPT 透传。
GordenSun/GordenPPTSkill (784⭐): AI 友好的 PPT 构建技能，17 套中文模板。
Michaelliv/pi-dynamic-workflows (630⭐): 动态工作流项目（TypeScript），Agent 流程编排。
FlashML-org/flashlib (418⭐): 快速且内存高效的经典机器学习算子库（Python）。

趋势洞察

今日 GitHub 趋势呈现明显的 Agent 生态化特征。Odysseus 和 PilotDeck 代表自托管 Agent 工作空间的兴起，与 vibecode-pro-max-kit 等技能管理工具形成互补。特别值得注意的是，从 Gemini Web 到 OpenAI API 的转换工具（gemini-web2api）持续火爆，反映了开发者对多模型灵活调用的强烈需求。Agent 技能生态（skill-creator、adhd）成为新热点，开发者不再只关注 Agent 本身，而是开始构建可组合、可复用的 Agent 能力模块。

启发

Agent 开发从”造轮子”转向”搭积木”阶段，关注技能生态、MCP 集成和跨平台兼容性。自托管和开源 Agent 方案正在挑战闭源服务，开发者应关注技能复用架构和工具链互操作性。

【PrimeScope News】

OpenAI Codex 可自主操作 Windows PC，自动查找漏洞和测试应用
OpenAI 的 Codex 应用现可在 Windows 11 上运行，配备 Computer Use 功能，使 AI 能独立控制程序、测试应用和查找漏洞。用户可通过手机 ChatGPT 远程启动和监控任务。

Google 开源 MCP Toolbox for Databases — Agent 数据库安全方案
Google 开源 MCP Toolbox for Databases，通过 YAML 配置文件预定义允许的数据操作，AI Agent 只能调用这些工具而非直接生成 SQL，防止权限过度授予和 SQL 注入问题。

Salesforce 声称 AI Agent 将 231 天数据迁移缩短至 13 天
Salesforce 使用 Claude Code（无令牌限制）完成数据迁移，原计划 231 天缩短至 13 天，PR 提升 79%，事故减少 5%。

Perplexity 测试 Computer Agent 每日摘要功能
Perplexity 正在为其 Computer Agent 开发每日摘要功能，从邮件、云盘、Linear、GitHub、Notion 等来源拉取每日更新，通过 Slack 推送。

人大&至知研究院开源 Claw Agent 全链条
发布 ClawGym 一体化框架，包含 13.5K 数据集、Agent 训练框架和 200 项评测任务。30B 模型超越 235B 基座模型。

微软与 NVIDIA 联手打造运行 AI Agent 的 AI PC
NVIDIA 以自家芯片切入 PC 市场，戴尔和微软 Surface 系列将亮相。微软基于 OpenClaw 框架让 AI Agent 在 Windows 本地处理任务。

Anthropic 为 Claude Code 推出动态工作流
Anthropic 在 Claude Code 中引入动态工作流，通过并行智能体处理子任务编排大型多步骤编码项目。Bun 的 75 万行 Zig 到 Rust 移植项目使用了此工作流。

Google Gemini Spark 全天候 AI 助手正式投入使用
Google 推出 Gemini Spark 全天候 AI 助手，自动处理收件箱摘要、规划本地活动等日常任务，实测效果出色。

Anthropic 发布 Claude Opus 4.8，估值达 9650 亿美元超越 OpenAI
旗舰模型升级，编程/推理/代理技能全面提升，引入工作量控制功能，快速模式速度提升 2.5 倍。完成 65 亿美元融资，估值首次超越 OpenAI。

OpenAI 赋予 GPT-5.5 Instant 可读性升级，淘汰 o3 和 GPT-4.5
更新使生成更自然回复，逐步淘汰两款旧模型，最晚 2026 年 8 月停止服务。

GitHub Copilot 按 token 计费引发开发者不满
从月费制转向 token 计费模式，开发者抱怨成本增加且不可预测。

Meta 泄露备忘录揭示 AI 吊坠与可穿戴设备战略
包括 AI 吊坠、超级感知智能眼镜、企业可穿戴设备三大产品线。

英伟达清华团队发布 Gamma-World：多智能体世界模型
登顶 HuggingFace 日榜，双人/四人 Minecraft 实时同步视角生成，采用 Simplex Encoding 身份对称编码。

Meta 用 AI 将数学教材翻译为超大 Lean 库
ATLAS 项目，26 本教科书自动翻译为 Lean 4 形式化代码，63 万行代码，2855 条定理。

软银计划向法国 AI 数据中心投资高达 750 亿欧元
约 870 亿美元，建设 5 吉瓦 AI 数据中心容量。

Google 推出端侧 AI 开发板 Coral Board
RISC-V 架构 Coral NPU，1TOPS 本地算力，面向耳机/AR 眼镜等设备。

趋势洞察

本周 AI Agent 领域迎来密集爆发：从云端到终端全面铺开。OpenAI Codex 的 Windows 自主操作能力标志着 Computer Use Agent 正式进入生产力场景；Salesforce 用实际数据证明 Agent 驱动的数据迁移能带来数量级的效率提升。安全方面，Google 的 MCP Toolbox 和人大 Claw 项目从不同角度解决 Agent 安全与可控性问题。硬件层面，微软与 NVIDIA 的 AI PC 合作预示着 Agent 将从云端下沉到本地设备。

启发

Agent 的落地路径已逐渐清晰：Computer Use（Codex）、工作流编排（Claude Code Dynamic Workflows）、数据迁移（Salesforce）、日常助理（Gemini Spark）四大场景。安全治理（MCP Toolbox）成为 Agent 规模化的前提条件。端侧 AI PC 的到来将带来全新 Agent 架构设计范式。

【Hugging Face Papers】

1. Skill0.5: Joint Skill Internalization and Utilization for Out-of-Distribution Generalization in Agentic Reinforcement Learning
该论文提出了一种全新的 Agent 技能学习框架——Skill0.5，旨在解决 Agent 技能”内化”与”外化”之间的根本矛盾。现有方法要么将技能作为显式的提示或函数（便于调用但泛化弱），要么将其隐式地融入模型参数（泛化强但难以控制）。Skill0.5 通过联合优化机制，让 Agent 既能将通用技能内化为模型能力，又能在新任务中灵活调用特定技能。实验表明在分布外泛化场景下效果显著，这对构建真正通用的 Autonomous Agent 至关重要。
📎 arXiv: https://arxiv.org/abs/2605.28424

2. PANDO: Efficient Multimodal AI Agents via Online Skill Distillation
PANDO 聚焦于多模态 Web Agent 的效率问题。现有 Agent 依赖大量推理时计算（如 rollout search、verifier passes），随着使用次数增加成本线性增长。PANDO 提出在线技能蒸馏框架——Agent 在执行任务过程中自动将成功的策略模式蒸馏为轻量级技能，后续同类任务直接复用而非重新推理。这种”越用越省”的设计理念解决了 Agent 规模化部署的核心成本瓶颈，使得复杂多模态 Agent 具备自主学习进化的能力。
📎 arXiv: https://arxiv.org/abs/2605.24785

3. Towards Verifiable Multimodal Deep Research: A Multi-Agent Harness for Interleaved Report Generation (Ptah)
Ptah 是一个多 Agent 深度研究报告生成系统，核心创新在于引入了可验证机制。传统 Deep Research 系统生成的长篇报告难以验证事实准确性，Ptah 通过多 Agent 协作架构——一个 Agent 负责检索与合成、另一个 Agent 专门负责验证每个陈述的可靠性，交叉引用来源。这种验证者-生成者的多 Agent 设计范式显著提升了 AI 研究报告的可信度，特别适用于需要严谨事实核查的科研场景。
📎 arXiv: https://arxiv.org/abs/2605.29861

4. When Cloud Agents Meet Device Agents: Lessons from Hybrid Multi-Agent Systems
本文系统性地探索了云端-终端混合多 Agent 系统的设计空间。随着端侧 SLM（小语言模型）能力提升，将部分 Agent 任务卸载到本地设备成为可能。论文提出了云端大模型负责复杂推理与规划、终端小模型负责实时响应与本地数据的协同架构，并量化了不同任务分割策略的成本-效益权衡。这对设计下一代分布式 Agent 系统具有重要指导意义，尤其是面向 AI PC 和移动设备的 Agent 部署。
📎 arXiv: https://arxiv.org/abs/2605.30102

5. CoHyDE: Iterative Co-Training of LLM Rewriter & Dense Encoder for Tool Retrieval
CoHyDE 解决的是 Agent 系统中的一个关键瓶颈——工具检索。当 Agent 面对大量 API 工具时，如何从非技术性的用户查询准确匹配到技术性的 API 文档？CoHyDE 提出了一种迭代协同训练方法：LLM Rewriter 将用户查询重写为更贴近 API 描述的格式，Dense Encoder 同时优化编码器以更好地理解改写后的查询。这种理解-检索互促进的循环训练机制显著提升了工具检索准确率，是 Agent 工具使用能力的基础支撑技术。
📎 arXiv: https://arxiv.org/abs/2605.29271

论文趋势洞察

今日 Agent 相关论文呈现出三大主线：一是效率优化（PANDO 的在线蒸馏、Skill0.5 的内外化平衡），说明 Agent 的规模化部署正从”能不能做”转向”能不能低成本地做”；二是验证机制（Ptah 的多 Agent 验证器范式），反映 Agent 输出可信度正在成为核心关注点；三是系统架构（云端-终端混合、工具检索），Agent 正从单体设计走向分布式、多层次的系统架构。

启发

Agent 研究的重心正在从”能力涌现”转向”工程效率”——在线学习、技能蒸馏、可验证性将成为 Agent 系统设计的核心原则。混合架构（云端+终端）和工具检索的实用化进展，预示着 Agent 将更深度地融入实际生产环境。

【GitHub Trending】

AI/ML Agent 项目

Agent 开发工具与技能生态

开发者工具与基础设施

趋势洞察

启发

【PrimeScope News】

趋势洞察

启发

【Hugging Face Papers】

论文趋势洞察

启发

You may also like...

AI Agent Trending | 2026-06-02

AI Agent Trending | 2026-06-18

AI Agent Trending | 2026-05-28

发表回复 取消回复

发表回复取消回复