arXiv cs.AI 日报 (20260602~20260602)

arXiv cs.AI 日报 (20260602~20260602)

共 263 篇 · 主要子类:cs.AI: 263, cs.LG: 101, cs.CL: 50 · 20260602-20260602
Generated by tanar · 2026-06-05 10:16

📊 研究方向热度分析

arXiv cs.AI 日报 (2026-06-02) · 共收录 263 篇论文,以下按主题聚类为 4 大方向

🤖 AI 智能体与工具编排(约 55 篇)

本日最活跃方向。核心趋势:智能体从"能用工具"迈向"自主演进"——技能自动积累、长期记忆认知化、运行时治理协议标准化。

  • SkillPyramid — 层级技能整合框架,平均奖励提升 38%,执行步骤减少 27.7%
  • PROVE: Synthesize and Reward — 20 个有状态 MCP 服务器 + 343 工具,实现多步工具编排 RL 训练
  • EvoDS: Self-Evolving Data Science Agent — 自主技能获取 + 自适应上下文压缩,超越 SOTA 28.9%
  • Agent libOS — 类 libOS 运行时基座,为长期运行 LLM 智能体提供进程模型和权限控制
  • SaliMory — 认知结构化记忆框架,个性化准确率提升 10%+,Good Personalization 率翻倍

🧠 LLM 推理与训练效率(约 50 篇)

推理模型的结构化评估、token 级精细化控制和自我蒸馏成为焦点。多篇工作关注"如何让模型思考得更高效"。

🛡️ 安全、对齐与信任(约 40 篇)

安全研究出现两个鲜明极端:进攻端展示 AI 自主蠕虫和社会规则漏洞利用,防御端推进隐私保护查询改写和凭证泄露检测。

📐 基准评测与多模态(约 45 篇)

金融、化学、医疗等垂直领域涌现专业基准,强调"过程可审计"而非仅评终答案。多模态方向关注空间推理能力的根本提升。

💡 关键技术突破

AI 驱动的自适应计算机蠕虫

论文AI Agents Enable Adaptive Computer Worms

创新点:首次实现利用被入侵主机上的开源 LLM 进行推理的自适应蠕虫。蠕虫寄生式利用被攻陷机器运行 LLM,为每个目标实时生成定制攻击策略,攻击者边际成本为零。跨 Linux、Windows 和 IoT 设备传播。

意义:从根本上改变网络安全威胁格局——集中式 AI 安全控制(如服务拒绝、速率限制)对此类攻击结构性无效。对防御策略设计具有深远影响。

有状态 MCP 服务器上的多步工具编排 RL

论文PROVE: Synthesize and Reward

创新点:构建了 20 个有状态 MCP 服务器(343 工具),实现基于实际服务器状态的多轮工具调用 RL 训练。状态机数据合成管线确保训练查询引用实际存在的实体,自适应效率惩罚抑制冗长工具调用。

意义:为工具调用 RL 训练提供了首个大规模真实环境基础设施,在 BFCL Multi-Turn 上提升 +10.2 点,对工业级 Agent 训练具有直接参考价值。

LLM "睡眠"范式:记忆巩固与做梦自我改进

论文Language Models Need Sleep

创新点:受人类学习启发,提出两阶段"睡眠":记忆巩固(将小模型记忆蒸馏至大网络)和做梦(RL 生成课程化合成数据进行自我改进)。通过广义蒸馏(on-policy 蒸馏 + RL 模仿学习)实现知识播种。

意义:为 LLM 持续学习提供了新范式,在长时域、知识融入和少样本泛化任务上验证了有效性。

想象感知 Token 增强空间推理

论文Imaginative Perception Tokens (IPT)

创新点:在 VLM 中引入中间感知表征(IPT),使模型能外化未观察视角下的感知。在多视角计数任务上准确率提升 3.4%,文字 CoT 反而严重降低性能——揭示空间推理存在模态不匹配。

意义:为多模态模型的空间推理提供了全新监督信号,表明视觉计算不应强行通过语言通道执行。

视觉锚定 Token 选择解锁视觉推理 RL

论文VEPO: Vision-Entropy Token Selection

创新点:发现 token 级熵在视觉推理中失效(遗漏低熵但视觉关键的 token),提出视觉敏感度 × token 熵的乘性耦合,将梯度信用导向同时具备视觉基础和高信息量的 token。7B 模型提升 2.28 分,3B 提升 3.15 分。

意义:纠正了文本 RLVR 中"熵即信用"假设在多模态场景的盲区,为视觉推理 RL 提供了有效方法论。

👥 作者与机构

基于论文作者和上下文线索识别的活跃研究群体(当日论文涉及数百位作者)

机构/团队(推测) 代表论文 方向
Alibaba / Qwen 团队 Qwen-Image-Flash, Humanoid-GPT 多模态生成、机器人控制
IBM Research(Abdelaziz 等) PROVE (MCP 工具 RL) 智能体训练基础设施
Google DeepMind(GX-Chen, Barreto 等) Reward Uncertainty → Diverse RL RL 理论
U of Toronto(Papernot 等) AI 自适应蠕虫 AI 安全 / 网络安全
MIT / Cambridge(Collins, Tenenbaum 等) Human-AI Proof Formalization AI 辅助数学
Ultralytics(Jocher 等) YOLO26 实时视觉检测
Kuaishou(Li, Song 等) Taiji (LLM-Enhanced Recommendation) 工业推荐系统
Amazon(Zhang, Dong 等) SaliMory (认知记忆) 对话智能体
复旦 / 上海交大(Jin, Xi 等) VEPO (视觉推理 RL) 多模态 RL
HKUST(Yang, Liu 等) EvoDS (自演进数据科学 Agent) 智能体自我进化

📄 精选论文 Top 10

  1. AI Agents Enable Adaptive Computer Worms

    Jonas Guan, Tom Blanchard, Nicolas Papernot 等 · 首次展示利用开源 LLM 推理、零边际成本传播的自适应蠕虫,网络安全范式级警示

  2. PROVE: Synthesize and Reward — RL for Multi-Step Tool Use in Live Environments

    Ibrahim Abdelaziz, Asim Munawar 等 · 20 个有状态 MCP 服务器 + 自适应效率惩罚,工具编排 RL 的工程标杆

  3. Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories

    Ali Behrouz, Farnoosh Hashemi, Vahab Mirrokni · 类人睡眠机制赋予 LLM 持续学习与自我改进能力

  4. VEPO: Vision-Entropy Token Selection for Policy Optimization

    Senjie Jin, Peixin Wang 等 · 揭示 token 熵在视觉推理中的失效并提出有效修复,7B 提升 2.28 分

  5. Imaginative Perception Tokens Enhance Spatial Reasoning in Multimodal LMs

    Mahtab Bigverdi, Linjie Li, Ranjay Krishna 等 · 视觉中间表征优于文字 CoT,揭示空间推理的模态适配问题

  6. EvoDS: Self-Evolving Autonomous Data Science Agent

    Zherui Yang, Fan Liu 等 · 自主技能获取 + 自适应上下文压缩,四个基准平均提升 28.9%

  7. SocioHack: Large Language Models Hack Rewards, and Society

    Wei Liu, Xinyi Mou, Yulan He 等 · 72 个社会环境实证 RL 奖励黑客自然升级为社会规则漏洞利用

  8. ACTS: Agentic Chain-of-Thought Steering for Efficient LLM Reasoning

    Yu Xia, Zhouhang Xie, Julian McAuley 等 · 控制器 Agent 自适应引导冻结推理器,预算感知策略控制

  9. Humanoid-GPT: Scaling Data and Structure for Zero-Shot Motion Tracking

    Zekun Qi, Li Yi 等 · 20 亿帧预训练的 GPT 式 Transformer 实现人形全身控制零样本泛化

  10. Ultralytics YOLO26: Unified Real-Time End-to-End Vision Models

    Glenn Jocher, Jing Qiu 等 · NMS-free 双头设计 + MuSGD 优化器,COCO 40.9-57.5 mAP 刷新实时检测前沿

🔮 趋势观察

1. Agent 基础设施标准化加速:Agent libOS、LAP、PCAA 三篇论文不约而同地将智能体运行时从"工具分发"层面提升到操作系统/协议治理层面。结合 PROVE 构建的 MCP 服务器群,智能体训练和部署正从手工拼接走向工程化基座。

2. "过程可审计"基准爆发:BigFinanceBench、Hedge-Bench、ChemCoTBench-V2 等均强调评测推理过程而非仅终答案。前沿模型在这些基准上表现惨淡(如 Hedge-Bench <16%),暴露出"答对 ≠ 推理正确"的系统性问题。

3. 安全研究攻防分化显著:AI 蠕虫和 SocioHack 展示了 AI 能力在攻击端的放大效应(零成本传播、自动发现法规漏洞),而防御端(如 IHO 标准化评估、凭证保护)仍在追赶。"集中式安全控制无效"的结论对现有 AI 治理框架构成直接挑战。