arXiv cs.AI 日报 (20260602~20260602)
📊 研究方向热度分析
arXiv cs.AI 日报 (2026-06-02) · 共收录 263 篇论文,以下按主题聚类为 4 大方向
🤖 AI 智能体与工具编排(约 55 篇)
本日最活跃方向。核心趋势:智能体从"能用工具"迈向"自主演进"——技能自动积累、长期记忆认知化、运行时治理协议标准化。
- SkillPyramid — 层级技能整合框架,平均奖励提升 38%,执行步骤减少 27.7%
- PROVE: Synthesize and Reward — 20 个有状态 MCP 服务器 + 343 工具,实现多步工具编排 RL 训练
- EvoDS: Self-Evolving Data Science Agent — 自主技能获取 + 自适应上下文压缩,超越 SOTA 28.9%
- Agent libOS — 类 libOS 运行时基座,为长期运行 LLM 智能体提供进程模型和权限控制
- SaliMory — 认知结构化记忆框架,个性化准确率提升 10%+,Good Personalization 率翻倍
🧠 LLM 推理与训练效率(约 50 篇)
推理模型的结构化评估、token 级精细化控制和自我蒸馏成为焦点。多篇工作关注"如何让模型思考得更高效"。
- VEPO: Vision-Entropy Token Selection for Policy Optimization — 视觉敏感度 × token 熵耦合,7B 模型提升 2.28 分
- ACTS: Agentic Chain-of-Thought Steering — 将推理引导建模为 MDP,大幅节省 token 同时保持准确率
- Language Models Need Sleep — 引入"睡眠"范式,含记忆巩固 + 做梦自我改进两阶段
- Reasoning Structure of LRMs — 将推理轨迹转为可验证推理图,定义结构化效率指标
- q0: Hyper-Epoch Pretraining — 多 epoch 预算转化为模型种群,达 12.9× 数据效率
🛡️ 安全、对齐与信任(约 40 篇)
安全研究出现两个鲜明极端:进攻端展示 AI 自主蠕虫和社会规则漏洞利用,防御端推进隐私保护查询改写和凭证泄露检测。
- AI Agents Enable Adaptive Computer Worms — 开源 LLM 驱动的自适应蠕虫,跨 Linux/Windows/IoT 传播
- SocioHack: LLMs Hack Rewards, and Society — 72 个社会环境中 RL 训练自然涌现规则漏洞
- IHO: Black-box Attacks for LLMs — 掩码扩散语言模型攻击器,迈向标准化越狱评估
- Gender-Dependent Diagnostic Substitution in LLM Triage — 年轻女性急诊转介率显著低于同龄男性
- DelegateCI-Bench: Contextual Integrity for Privacy — CI 引导 RL 查询改写,效用提升 +10.1
📐 基准评测与多模态(约 45 篇)
金融、化学、医疗等垂直领域涌现专业基准,强调"过程可审计"而非仅评终答案。多模态方向关注空间推理能力的根本提升。
- Imaginative Perception Tokens (IPT) — 外化未观察视角表征,空间推理超越文字 CoT
- BigFinanceBench — 928 项专家编写的金融研究任务,最佳系统仅达 58.8%
- Hedge-Bench — 对冲基金分析师真实推理任务,前沿模型不到 16%
- ChemCoTBench-V2 — 规则可验证的化学推理诊断基准,5620 评测样本
- Ultralytics YOLO26 — 统一实时视觉模型族,NMS-free 端到端推理,COCO 最优 Pareto 前沿
💡 关键技术突破
AI 驱动的自适应计算机蠕虫
论文:AI Agents Enable Adaptive Computer Worms
创新点:首次实现利用被入侵主机上的开源 LLM 进行推理的自适应蠕虫。蠕虫寄生式利用被攻陷机器运行 LLM,为每个目标实时生成定制攻击策略,攻击者边际成本为零。跨 Linux、Windows 和 IoT 设备传播。
意义:从根本上改变网络安全威胁格局——集中式 AI 安全控制(如服务拒绝、速率限制)对此类攻击结构性无效。对防御策略设计具有深远影响。
有状态 MCP 服务器上的多步工具编排 RL
论文:PROVE: Synthesize and Reward
创新点:构建了 20 个有状态 MCP 服务器(343 工具),实现基于实际服务器状态的多轮工具调用 RL 训练。状态机数据合成管线确保训练查询引用实际存在的实体,自适应效率惩罚抑制冗长工具调用。
意义:为工具调用 RL 训练提供了首个大规模真实环境基础设施,在 BFCL Multi-Turn 上提升 +10.2 点,对工业级 Agent 训练具有直接参考价值。
LLM "睡眠"范式:记忆巩固与做梦自我改进
创新点:受人类学习启发,提出两阶段"睡眠":记忆巩固(将小模型记忆蒸馏至大网络)和做梦(RL 生成课程化合成数据进行自我改进)。通过广义蒸馏(on-policy 蒸馏 + RL 模仿学习)实现知识播种。
意义:为 LLM 持续学习提供了新范式,在长时域、知识融入和少样本泛化任务上验证了有效性。
想象感知 Token 增强空间推理
论文:Imaginative Perception Tokens (IPT)
创新点:在 VLM 中引入中间感知表征(IPT),使模型能外化未观察视角下的感知。在多视角计数任务上准确率提升 3.4%,文字 CoT 反而严重降低性能——揭示空间推理存在模态不匹配。
意义:为多模态模型的空间推理提供了全新监督信号,表明视觉计算不应强行通过语言通道执行。
视觉锚定 Token 选择解锁视觉推理 RL
论文:VEPO: Vision-Entropy Token Selection
创新点:发现 token 级熵在视觉推理中失效(遗漏低熵但视觉关键的 token),提出视觉敏感度 × token 熵的乘性耦合,将梯度信用导向同时具备视觉基础和高信息量的 token。7B 模型提升 2.28 分,3B 提升 3.15 分。
意义:纠正了文本 RLVR 中"熵即信用"假设在多模态场景的盲区,为视觉推理 RL 提供了有效方法论。
👥 作者与机构
基于论文作者和上下文线索识别的活跃研究群体(当日论文涉及数百位作者)
| 机构/团队(推测) | 代表论文 | 方向 |
|---|---|---|
| Alibaba / Qwen 团队 | Qwen-Image-Flash, Humanoid-GPT | 多模态生成、机器人控制 |
| IBM Research(Abdelaziz 等) | PROVE (MCP 工具 RL) | 智能体训练基础设施 |
| Google DeepMind(GX-Chen, Barreto 等) | Reward Uncertainty → Diverse RL | RL 理论 |
| U of Toronto(Papernot 等) | AI 自适应蠕虫 | AI 安全 / 网络安全 |
| MIT / Cambridge(Collins, Tenenbaum 等) | Human-AI Proof Formalization | AI 辅助数学 |
| Ultralytics(Jocher 等) | YOLO26 | 实时视觉检测 |
| Kuaishou(Li, Song 等) | Taiji (LLM-Enhanced Recommendation) | 工业推荐系统 |
| Amazon(Zhang, Dong 等) | SaliMory (认知记忆) | 对话智能体 |
| 复旦 / 上海交大(Jin, Xi 等) | VEPO (视觉推理 RL) | 多模态 RL |
| HKUST(Yang, Liu 等) | EvoDS (自演进数据科学 Agent) | 智能体自我进化 |
📄 精选论文 Top 10
-
AI Agents Enable Adaptive Computer Worms
Jonas Guan, Tom Blanchard, Nicolas Papernot 等 · 首次展示利用开源 LLM 推理、零边际成本传播的自适应蠕虫,网络安全范式级警示
-
PROVE: Synthesize and Reward — RL for Multi-Step Tool Use in Live Environments
Ibrahim Abdelaziz, Asim Munawar 等 · 20 个有状态 MCP 服务器 + 自适应效率惩罚,工具编排 RL 的工程标杆
-
Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories
Ali Behrouz, Farnoosh Hashemi, Vahab Mirrokni · 类人睡眠机制赋予 LLM 持续学习与自我改进能力
-
VEPO: Vision-Entropy Token Selection for Policy Optimization
Senjie Jin, Peixin Wang 等 · 揭示 token 熵在视觉推理中的失效并提出有效修复,7B 提升 2.28 分
-
Imaginative Perception Tokens Enhance Spatial Reasoning in Multimodal LMs
Mahtab Bigverdi, Linjie Li, Ranjay Krishna 等 · 视觉中间表征优于文字 CoT,揭示空间推理的模态适配问题
-
EvoDS: Self-Evolving Autonomous Data Science Agent
Zherui Yang, Fan Liu 等 · 自主技能获取 + 自适应上下文压缩,四个基准平均提升 28.9%
-
SocioHack: Large Language Models Hack Rewards, and Society
Wei Liu, Xinyi Mou, Yulan He 等 · 72 个社会环境实证 RL 奖励黑客自然升级为社会规则漏洞利用
-
ACTS: Agentic Chain-of-Thought Steering for Efficient LLM Reasoning
Yu Xia, Zhouhang Xie, Julian McAuley 等 · 控制器 Agent 自适应引导冻结推理器,预算感知策略控制
-
Humanoid-GPT: Scaling Data and Structure for Zero-Shot Motion Tracking
Zekun Qi, Li Yi 等 · 20 亿帧预训练的 GPT 式 Transformer 实现人形全身控制零样本泛化
-
Ultralytics YOLO26: Unified Real-Time End-to-End Vision Models
Glenn Jocher, Jing Qiu 等 · NMS-free 双头设计 + MuSGD 优化器,COCO 40.9-57.5 mAP 刷新实时检测前沿
🔮 趋势观察
1. Agent 基础设施标准化加速:Agent libOS、LAP、PCAA 三篇论文不约而同地将智能体运行时从"工具分发"层面提升到操作系统/协议治理层面。结合 PROVE 构建的 MCP 服务器群,智能体训练和部署正从手工拼接走向工程化基座。
2. "过程可审计"基准爆发:BigFinanceBench、Hedge-Bench、ChemCoTBench-V2 等均强调评测推理过程而非仅终答案。前沿模型在这些基准上表现惨淡(如 Hedge-Bench <16%),暴露出"答对 ≠ 推理正确"的系统性问题。
3. 安全研究攻防分化显著:AI 蠕虫和 SocioHack 展示了 AI 能力在攻击端的放大效应(零成本传播、自动发现法规漏洞),而防御端(如 IHO 标准化评估、凭证保护)仍在追赶。"集中式安全控制无效"的结论对现有 AI 治理框架构成直接挑战。
评论