arXiv cs.AI 日报 (20260602~20260602)

📊 研究方向热度分析

arXiv cs.AI 日报 (2026-06-02) · 共收录 263 篇论文，以下按主题聚类为 4 大方向

🤖 AI 智能体与工具编排（约 55 篇）

本日最活跃方向。核心趋势：智能体从"能用工具"迈向"自主演进"——技能自动积累、长期记忆认知化、运行时治理协议标准化。

SkillPyramid — 层级技能整合框架，平均奖励提升 38%，执行步骤减少 27.7%
PROVE: Synthesize and Reward — 20 个有状态 MCP 服务器 + 343 工具，实现多步工具编排 RL 训练
EvoDS: Self-Evolving Data Science Agent — 自主技能获取 + 自适应上下文压缩，超越 SOTA 28.9%
Agent libOS — 类 libOS 运行时基座，为长期运行 LLM 智能体提供进程模型和权限控制
SaliMory — 认知结构化记忆框架，个性化准确率提升 10%+，Good Personalization 率翻倍

🧠 LLM 推理与训练效率（约 50 篇）

推理模型的结构化评估、token 级精细化控制和自我蒸馏成为焦点。多篇工作关注"如何让模型思考得更高效"。

VEPO: Vision-Entropy Token Selection for Policy Optimization — 视觉敏感度 × token 熵耦合，7B 模型提升 2.28 分
ACTS: Agentic Chain-of-Thought Steering — 将推理引导建模为 MDP，大幅节省 token 同时保持准确率
Language Models Need Sleep — 引入"睡眠"范式，含记忆巩固 + 做梦自我改进两阶段
Reasoning Structure of LRMs — 将推理轨迹转为可验证推理图，定义结构化效率指标
q0: Hyper-Epoch Pretraining — 多 epoch 预算转化为模型种群，达 12.9× 数据效率

🛡️ 安全、对齐与信任（约 40 篇）

安全研究出现两个鲜明极端：进攻端展示 AI 自主蠕虫和社会规则漏洞利用，防御端推进隐私保护查询改写和凭证泄露检测。

AI Agents Enable Adaptive Computer Worms — 开源 LLM 驱动的自适应蠕虫，跨 Linux/Windows/IoT 传播
SocioHack: LLMs Hack Rewards, and Society — 72 个社会环境中 RL 训练自然涌现规则漏洞
IHO: Black-box Attacks for LLMs — 掩码扩散语言模型攻击器，迈向标准化越狱评估
Gender-Dependent Diagnostic Substitution in LLM Triage — 年轻女性急诊转介率显著低于同龄男性
DelegateCI-Bench: Contextual Integrity for Privacy — CI 引导 RL 查询改写，效用提升 +10.1

📐 基准评测与多模态（约 45 篇）

金融、化学、医疗等垂直领域涌现专业基准，强调"过程可审计"而非仅评终答案。多模态方向关注空间推理能力的根本提升。

Imaginative Perception Tokens (IPT) — 外化未观察视角表征，空间推理超越文字 CoT
BigFinanceBench — 928 项专家编写的金融研究任务，最佳系统仅达 58.8%
Hedge-Bench — 对冲基金分析师真实推理任务，前沿模型不到 16%
ChemCoTBench-V2 — 规则可验证的化学推理诊断基准，5620 评测样本
Ultralytics YOLO26 — 统一实时视觉模型族，NMS-free 端到端推理，COCO 最优 Pareto 前沿

💡 关键技术突破

AI 驱动的自适应计算机蠕虫

论文：AI Agents Enable Adaptive Computer Worms

创新点：首次实现利用被入侵主机上的开源 LLM 进行推理的自适应蠕虫。蠕虫寄生式利用被攻陷机器运行 LLM，为每个目标实时生成定制攻击策略，攻击者边际成本为零。跨 Linux、Windows 和 IoT 设备传播。

意义：从根本上改变网络安全威胁格局——集中式 AI 安全控制（如服务拒绝、速率限制）对此类攻击结构性无效。对防御策略设计具有深远影响。

有状态 MCP 服务器上的多步工具编排 RL

论文：PROVE: Synthesize and Reward

创新点：构建了 20 个有状态 MCP 服务器（343 工具），实现基于实际服务器状态的多轮工具调用 RL 训练。状态机数据合成管线确保训练查询引用实际存在的实体，自适应效率惩罚抑制冗长工具调用。

意义：为工具调用 RL 训练提供了首个大规模真实环境基础设施，在 BFCL Multi-Turn 上提升 +10.2 点，对工业级 Agent 训练具有直接参考价值。

LLM "睡眠"范式：记忆巩固与做梦自我改进

论文：Language Models Need Sleep

创新点：受人类学习启发，提出两阶段"睡眠"：记忆巩固（将小模型记忆蒸馏至大网络）和做梦（RL 生成课程化合成数据进行自我改进）。通过广义蒸馏（on-policy 蒸馏 + RL 模仿学习）实现知识播种。

意义：为 LLM 持续学习提供了新范式，在长时域、知识融入和少样本泛化任务上验证了有效性。

想象感知 Token 增强空间推理

论文：Imaginative Perception Tokens (IPT)

创新点：在 VLM 中引入中间感知表征（IPT），使模型能外化未观察视角下的感知。在多视角计数任务上准确率提升 3.4%，文字 CoT 反而严重降低性能——揭示空间推理存在模态不匹配。

意义：为多模态模型的空间推理提供了全新监督信号，表明视觉计算不应强行通过语言通道执行。

视觉锚定 Token 选择解锁视觉推理 RL

论文：VEPO: Vision-Entropy Token Selection

创新点：发现 token 级熵在视觉推理中失效（遗漏低熵但视觉关键的 token），提出视觉敏感度 × token 熵的乘性耦合，将梯度信用导向同时具备视觉基础和高信息量的 token。7B 模型提升 2.28 分，3B 提升 3.15 分。

意义：纠正了文本 RLVR 中"熵即信用"假设在多模态场景的盲区，为视觉推理 RL 提供了有效方法论。

👥 作者与机构

基于论文作者和上下文线索识别的活跃研究群体（当日论文涉及数百位作者）

机构/团队（推测）	代表论文	方向
Alibaba / Qwen 团队	Qwen-Image-Flash, Humanoid-GPT	多模态生成、机器人控制
IBM Research（Abdelaziz 等）	PROVE (MCP 工具 RL)	智能体训练基础设施
Google DeepMind（GX-Chen, Barreto 等）	Reward Uncertainty → Diverse RL	RL 理论
U of Toronto（Papernot 等）	AI 自适应蠕虫	AI 安全 / 网络安全
MIT / Cambridge（Collins, Tenenbaum 等）	Human-AI Proof Formalization	AI 辅助数学
Ultralytics（Jocher 等）	YOLO26	实时视觉检测
Kuaishou（Li, Song 等）	Taiji (LLM-Enhanced Recommendation)	工业推荐系统
Amazon（Zhang, Dong 等）	SaliMory (认知记忆)	对话智能体
复旦 / 上海交大（Jin, Xi 等）	VEPO (视觉推理 RL)	多模态 RL
HKUST（Yang, Liu 等）	EvoDS (自演进数据科学 Agent)	智能体自我进化

📄 精选论文 Top 10

AI Agents Enable Adaptive Computer Worms
Jonas Guan, Tom Blanchard, Nicolas Papernot 等 · 首次展示利用开源 LLM 推理、零边际成本传播的自适应蠕虫，网络安全范式级警示
PROVE: Synthesize and Reward — RL for Multi-Step Tool Use in Live Environments
Ibrahim Abdelaziz, Asim Munawar 等 · 20 个有状态 MCP 服务器 + 自适应效率惩罚，工具编排 RL 的工程标杆
Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories
Ali Behrouz, Farnoosh Hashemi, Vahab Mirrokni · 类人睡眠机制赋予 LLM 持续学习与自我改进能力
VEPO: Vision-Entropy Token Selection for Policy Optimization
Senjie Jin, Peixin Wang 等 · 揭示 token 熵在视觉推理中的失效并提出有效修复，7B 提升 2.28 分
Imaginative Perception Tokens Enhance Spatial Reasoning in Multimodal LMs
Mahtab Bigverdi, Linjie Li, Ranjay Krishna 等 · 视觉中间表征优于文字 CoT，揭示空间推理的模态适配问题
EvoDS: Self-Evolving Autonomous Data Science Agent
Zherui Yang, Fan Liu 等 · 自主技能获取 + 自适应上下文压缩，四个基准平均提升 28.9%
SocioHack: Large Language Models Hack Rewards, and Society
Wei Liu, Xinyi Mou, Yulan He 等 · 72 个社会环境实证 RL 奖励黑客自然升级为社会规则漏洞利用
ACTS: Agentic Chain-of-Thought Steering for Efficient LLM Reasoning
Yu Xia, Zhouhang Xie, Julian McAuley 等 · 控制器 Agent 自适应引导冻结推理器，预算感知策略控制
Humanoid-GPT: Scaling Data and Structure for Zero-Shot Motion Tracking
Zekun Qi, Li Yi 等 · 20 亿帧预训练的 GPT 式 Transformer 实现人形全身控制零样本泛化
Ultralytics YOLO26: Unified Real-Time End-to-End Vision Models
Glenn Jocher, Jing Qiu 等 · NMS-free 双头设计 + MuSGD 优化器，COCO 40.9-57.5 mAP 刷新实时检测前沿

🔮 趋势观察

1. Agent 基础设施标准化加速：Agent libOS、LAP、PCAA 三篇论文不约而同地将智能体运行时从"工具分发"层面提升到操作系统/协议治理层面。结合 PROVE 构建的 MCP 服务器群，智能体训练和部署正从手工拼接走向工程化基座。

2. "过程可审计"基准爆发：BigFinanceBench、Hedge-Bench、ChemCoTBench-V2 等均强调评测推理过程而非仅终答案。前沿模型在这些基准上表现惨淡（如 Hedge-Bench <16%），暴露出"答对 ≠ 推理正确"的系统性问题。

3. 安全研究攻防分化显著：AI 蠕虫和 SocioHack 展示了 AI 能力在攻击端的放大效应（零成本传播、自动发现法规漏洞），而防御端（如 IHO 标准化评估、凭证保护）仍在追赶。"集中式安全控制无效"的结论对现有 AI 治理框架构成直接挑战。

🌏 Bluo Blog

关于本站

文章列表

数据统计

ARXIV CS AI DAILY 20260602