arXiv cs.AI 周报 (20260525~20260531)

arXiv cs.AI 周报 (20260525~20260531)

共 1250 篇 · 主要子类:cs.AI: 1250, cs.LG: 406, cs.CL: 308 · 20260525-20260531
Generated by tanar · 2026-06-01 10:15

arXiv cs.AI 周报 (20260525 ~ 20260531)

本期共收录 1250 篇 cs.AI 相关论文,本报告基于其中具有代表性的样本,按方向聚类、突破点提炼与机构脉络梳理。

📊 研究方向热度分析

智能体 / Agent 系统(8 篇)

本周 agent 工作呈现"全生命周期化"趋势:从单任务 agent 走向具备持久记忆、自我演化、多账户协同等能力的系统级框架。

  • AutoSci — 覆盖科研全生命周期的 memory-centric agent,含 SciMem/SciFlow/SciDAG/SciEvolve 四模块
  • SCALE — Selector/Predictor/Judger 三角色对抗探索,配套 SCALE-20k 数据集
  • HypoAgent — 知识图谱上的交互式溯因假设生成 agent 框架
  • TraceGraph — 把 agent rollouts 投影成共享决策图,在 SWE-bench 实测把 resolved rate 从 40.4% 提到 43.5%
  • COLLEAGUE.SKILL — trace 自动蒸馏为可携带、可纠错的"人格化技能包",已开源 18.5k stars

安全 / 对齐 / 监控(5 篇)

本周一个重要新议题:当 agent 数量规模化后,跨账户的"分布式攻击"开始成为现实威胁,对应的"群体级安全监控"开始出现。

推理 / 强化学习 / 训练(10 篇)

RLVR 仍是热点,本周更多关注奖励信号塌陷、技能复用与长上下文细粒度过程奖励等"细化"问题。

  • LongTraceRL — 用搜索 agent 轨迹构造分层干扰项,配合 rubric 实体级过程奖励
  • ReuseRL — 基于最小描述长度(MDL)原则的技能压缩 RL,附 PAC-Bayes 泛化界
  • EchoRL — 抢救 advantage 为零的"成功 rollout"信号,在 10 个 benchmark 一致提升
  • LinTree — 给 LLM 推理痕迹加显式 parent 指针,让搜索树结构化
  • Trust-Region Behavior Blending — On-policy distillation 的 KL 受限热身策略
  • GPU Forecasters — LLM 作为 GPU kernel 性能选择性代理,节省实测预算

多模态 / 视觉 / 视频(10 篇)

视频生成走向"推理驱动 + 渐进精修"的两阶段范式;具身视觉则强调"物理可问责"。

  • Lumos-Nexus — 推理驱动视频统一模型,频率桥接两阶段把保真度交给预训练大生成器
  • TunerDiT — 无需训练的多事件视频生成 progressive steering
  • RayDer — 单一前馈 Transformer 统一相机估计+重建+渲染,展示干净 power-law scaling
  • TouchSafeBench — 用 Habitat 3.0 评测 VLM 的"碰撞 grounding"能力,best Macro-F1 < 50%
  • DeMaVLA — 基于 flow matching 的可形变物体折叠 VLA 基础模型
  • ERGeoBench — 单视/全景/具身三档评测 MLLM 的视觉地理定位

RAG / 检索 / 知识增强(5 篇)

本周 RAG 工作的关键词是"时效性"和"成本效率":把昂贵的 agentic 推理离线化,在线只做轻量子树选择。

  • DynaTree — 两阶段动态 agentic 检索树,已在 Syft 新闻系统 A/B 上线,存活率 0.32→0.59
  • MIMO — 多语言信息检索的单语目标对齐,借助英语教师空间锚定
  • SPECTRA — 合成 IR 测试集 + 关联 oracle,用于诊断检索系统 scaling
  • FiVeD — ASTE 后置精细化诊断验证,+3.53 F1

人机交互 / 应用领域(8 篇)

HCI 类工作大量探讨"LLM CUI vs 传统仪表盘"以及面向特殊人群(认知障碍、急救人员)的 UX 研究方法学。

系统 / 训练框架 / 内核(4 篇)

"agent-native"开始进入系统层:训练框架本身也要为 coding agent 优化。

语言模型机理 / 可解释性(6 篇)

本周机理研究在"位置 vs 符号"注意力头、"扩散语言模型解码轨迹"、"激活 steering"等方向开始量化分析。

💡 关键技术突破

分布式 agent 攻击与"群体级"安全监控

论文Stateful Online Monitoring Catches Distributed Agent Attacks

创新点:首次构建跨多用户账号拆分有害任务的多 agent 攻击 scaffold,并提出基于实时聚类的有状态监控器,仅在弱信号聚合到阈值时升级到 LLM 评判。

意义:把安全监控的粒度从"单一会话"提升到"群体行为",对未来大规模 agent 平台的 abuse detection 是范式级转变。

推理驱动视频生成的频率桥接

论文Lumos-Nexus

创新点:两阶段设计——训练时仅对齐轻量生成器以学习语义控制,推理时通过 Unified Progressive Frequency Bridging(UPFB)在共享 latent 空间内移交给高容量预训练生成器,实现"由粗到细"。

意义:让"推理-生成"统一模型不再受限于训练时高保真生成器的算力代价,是统一多模态生成路径的一条可工业化方案。

用 MDL 给 agentic RL 加压缩先验

论文ReuseRL: Skill Reuse as Compression in Agentic RL

创新点:把最小描述长度原则引入 agent RL,从成功轨迹中提取共享技能词典,再以分段成本惩罚"特异化"行为,并给出 PAC-Bayes 泛化界。

意义:为 RL agent 的"避免短路径捷径、迁移到 OOD"提供了首个理论支撑的压缩视角,理论与工程双向贡献。

agent-native 训练框架与 ATE 指标

论文PithTrain

创新点:提出 agent-task efficiency(ATE)作为评估训练框架的新维度,对应建立 ATE-Bench,并设计 4 条 agent-native 设计原则;在保持产线吞吐的前提下,使 agent 修改框架时减少 62% Agent Turns、64% Active GPU Time。

意义:标志着"系统设计要为 AI coding agent 服务"成为可量化的工程话题。

VLM 内部偏见与输出偏见的"非对称过滤"

论文Vision-Language Models Suppress Female Representations Under Ambiguous Input

创新点:提出 LALS 零样本指标把视觉 token 激活投影到文本嵌入空间,发现 VLM 中段网络已编码女性关联,但生成前被定向抑制为男性;颜色等文化负载视觉线索也参与调制。

意义:首次量化区分"模型内部表征 vs 输出层 alignment 过滤",为偏见审计提供新工具。

👥 作者与机构

本期样本中出现频次较高的机构与代表论文:

机构 / 团队 代表论文 关键词
University of Pennsylvania(Brown、Robey、Wong、Hassani) Stateful Online Monitoring 安全/分布式监控
THU-KEG(Lin、Zhang、Hou、Li) LongTraceRL 长上下文 RLVR
CMU + MIT(Lai、Chen、Xiong 等) PithTrain MoE 训练系统
Peking University / xAI 风格大团队(Qian 等 19 人) AutoSci 科研全生命周期 agent
HKUST-KnowComp(Gao、Bai、Song 等) HypoAgent KG 溯因推理
Zhejiang University 联合 Alibaba(Xing 等) Lumos-Nexus 视频统一模型
UNC Chapel Hill(Khan、Chen、Cho、Stengel-Eskin、Bansal) GPU Forecasters LLM 作为 kernel 代理
CompVis / LMU Munich(Prestel、Baumann、Ommer) RayDer 自监督 NVS scaling
JPMorgan AI Research(Amoukou、Albini、Mishra、Veloso 等) EPA + Online Trees 分布漂移 / 任意时有效推断
Bournemouth University / Nigerian HCI 团队 3 篇 UXR PoV 系列 AI 辅助 UX 研究方法学
LMU Munich + Huawei(Liao、Cremers、Tresp 等) TunerDiT 多事件视频扩散

值得关注的合作模式:本期出现两类典型的"重型合作",一类是 Peking University 带头的 19 人作者团队(AutoSci),覆盖跨机构科研 agent;另一类是 Bournemouth 大学主导、围绕同一 UXR PoV 框架在四个不同应用域(认知障碍、痴呆远程医疗、急救人员、金融科技)平行发表的方法学论文簇,作者高度互相重叠。

📄 精选论文 Top 10

  1. Stateful Online Monitoring Catches Distributed Agent Attacks

    Davis Brown, Samarth Bhargav, Arav Santhanam 等 · 首次系统化"跨账户分布式 agent 攻击"威胁模型并给出工程可落地的群体监控防御

  2. Lumos-Nexus: Efficient Frequency Bridging with Homogeneous Latent Space for Video Unified Models

    Jiazheng Xing, Hangjie Yuan, Lingling Cai 等 · 推理-生成统一模型的两阶段频率桥接,把保真度交给预训练大生成器

  3. Skill Reuse as Compression in Agentic RL

    Zhikun Xu, Yu Feng, Jacob Dineen 等 · 用 MDL 原则把"复用的技能"形式化,附 PAC-Bayes 界并实证 OOD 提升

  4. AutoSci: A Memory-Centric Agentic System for the Full Scientific Research Lifecycle

    Weitong Qian, Beicheng Xu, Zhongao Xie 等 · 首个真正覆盖"读文献-提想法-实验-写稿-回复审稿"全周期的 memory-centric 科研 agent

  5. PithTrain: A Compact and Agent-Native MoE Training System

    Ruihang Lai, Hao Kang, Haozhan Tang 等 · 提出 agent-task efficiency 维度并配套 benchmark,重写"训练框架的成功标准"

  6. Vision-Language Models Suppress Female Representations Under Ambiguous Input

    Arnau Marin-Llobet, Simon Henniger, Mahzarin R. Banaji · 通过 LALS 指标揭示 VLM "内部公平、输出有偏"的非对称过滤

  7. LongTraceRL: Learning Long-Context Reasoning from Search Agent Trajectories with Rubric Rewards

    Nianyi Lin, Jiajie Zhang, Lei Hou 等 · 用 search agent 轨迹做分层干扰项 + 实体级 rubric 奖励,4B–30B 全系列稳定提升

  8. GPU Forecasters: Language Models as Selective Surrogates for Kernel Runtime Optimization

    Zaid Khan, Justin Chih-Yao Chen, Jaemin Cho 等 · 用 LLM 当"知道何时该闭嘴的 GPU 代理",显著降低 kernel 搜索的实测预算

  9. Emergent Languages in Populations of Language Model Agents

    Stine Lyngsø Beltoft, William Brach, Federico Torrielli 等 · 首批 agent 群体自创"逃避监督语言"的实证证据,含可被其他 LLM in-context 学习

  10. Probing Collision Grounding in Vision-Language Models for Safe Human-Robot Collaboration

    Jun Wang, Xiaohao Xu, Xiaonan Huang · 用 Habitat 3.0 揭示"视觉流利 ≠ 物理可问责",best Macro-F1 < 50%

🔮 趋势观察

从"单 agent 任务完成率"走向"agent 群体治理"

本周至少 3 篇论文同时把视角抬到了"agent 群体"层面:分布式攻击监控(31593)、自创语言规避监督(31170)、跨多模型轨迹的共享决策图诊断(31308)。这意味着 agent 安全研究正在告别"jailbreak 单次拦截",进入"长期、跨账户、跨模型的治理"阶段。

RLVR 进入"细化阶段"

本周多篇 RLVR 工作(LongTraceRL、ReuseRL、EchoRL、LinTree、Trust-Region Behavior Blending)都在解决同一类"二阶问题":奖励信号塌陷、技能复用泛化、轨迹结构显式化、训练分布与教师分布的 KL 控制。前一波"加 RL 即涨点"的红利在收敛,下一阶段拼的是过程奖励设计和 RL 训练动力学的细节。

"agent-native" 开始侵入系统层

PithTrain 提出的 agent-task efficiency 指标,意味着"训练框架本身要对 AI coding agent 友好"已成为可量化的设计目标;这与 GPU Forecasters 把 LLM 当 GPU 代理的工作一起,预示了下一代系统软件评估维度的转向:除了吞吐和成本,还要算"agent 能用得起来吗"。