Bluo Blog

arXiv cs.AI 周报 (20260301)

📚 共 527 篇论文 📅 时间范围: 2026年2月23日～ 2026年3月1日 🏷️ 分类: cs.AI

📊 研究方向热度分析

🤖 LLM Agents 154篇

大模型智能体是本月最热门研究方向，涵盖多步推理、工具调用、自主决策等核心能力。

🎮 Reinforcement Learning 200篇

强化学习研究热度最高，涵盖策略优化、安全RL、多任务学习等前沿方向。

👁️ Vision-Language Models 64篇

视觉语言模型研究持续活跃，关注多模态对齐、跨模态推理等关键问题。

Unified Vision-Language Modeling via Concept Space Alignment
Yifu Qiu, Paul-Ambroise Duquenne, Holger Schwenk
TC-SSA: Token Compression via Semantic Slot Aggregation for Pathology
Zhuo Chen, Shawn Young, Lijian Xu
ATA: Bridging Implicit Reasoning for Vision-Language Action Models
Cheng Yang, Jianhao Jiao, Lingyi Huang et al.
CAPT: Confusion-Aware Prompt Tuning for Vision-Language Misalignment
Maoyuan Shao, Yutong Gao, Xinyang Huang et al.

🛡️ Safety & Alignment 66篇

安全与对齐研究关注模型安全、隐私保护、对抗攻击防御等关键议题。

Defensive Refusal Bias: How Safety Alignment Fails Cyber Defenders
David Campbell, Neil Kale, Udari Madhushani Sehwag et al.
Token-level Data Selection for Safe LLM Fine-tuning
Yanping Li, Zhening Liu, Zijian Li et al.
Attention Smoothing Is All You Need For Unlearning
Saleh Zare Zade, Xiangyu Zhou, Sijia Liu et al.
Turning Black Box into White Box: Dataset Distillation Leaks
Huajie Chen, Tianqing Zhu, Yuchen Zhong et al.
Contextualized Privacy Defense for LLM Agents
Yule Wen, Yanzhe Zhang, Jianxun Lian et al.

🏥 Medical AI 31篇

医疗AI研究涵盖影像诊断、病理分析、蛋白质功能预测等临床应用。

MAMA-MIA Challenge: Breast MRI Tumor Segmentation
Lidia Garrucho, Smriti Joshi, Kaisar Kushibar et al.
FCN-LLM: Empower LLM for Brain Functional Connectivity Network
Xingcan Hu, Wei Wang, Li Xiao
OpenRad: A Curated Repository of Open-access AI models for Radiology
Konstantinos Vrettos, Galini Papadaki et al.
ProtRLSearch: Multi-Round Multimodal Protein Search Agent
Congying Liu, Taihao Li, Ming Huang et al.

📚 RAG & Memory 152篇

检索增强生成与记忆机制研究蓬勃发展，关注动态索引、结构化存储等。

GAM-RAG: Gain-Adaptive Memory for Evolving Retrieval
Yifan Wang, Mingxuan Jiang, Zhihao Sun et al.
Modular Memory is the Key to Continual Learning Agents
Vaggelis Dorovatas, Malte Schwerin, Andrew D. Bagdanov et al.
MetaState: Persistent Working Memory for Discrete Diffusion LLMs
Kejing Xia, Mingzhe Li, Lixuan Wei et al.
Odin: Multi-Signal Graph Intelligence for Autonomous Discovery
Muyukani Kizito, Elizabeth Nyambere

🎨 Diffusion Models 27篇

扩散模型研究涵盖离散扩散语言模型、逆向问题求解、运动规划等方向。

🔗 Graph Neural Networks 57篇

图神经网络研究关注可解释性、持续学习、异构图处理等核心问题。

Revealing Combinatorial Reasoning of GNNs via Graph Concept Bottleneck Layer
Yue Niu, Zhaokai Sun, Jiayi Yang et al.
FreeGNN: Continual Source-Free Graph Domain Adaptation
Abderaouf Bahi, Amel Ourici, Ibtissem Gasmi et al.
Causal Neural Probabilistic Circuits
Weixin Chen, Han Zhao

🦾 Robotics & Embodied AI 87篇

机器人与具身智能研究涵盖导航、操控、人机交互等关键应用场景。

⚡ Efficiency & Optimization 86篇

效率优化研究关注量化、剪枝、推理加速等模型压缩与部署技术。

SageBwd: A Trainable Low-bit Attention
Jintao Zhang, Marco Chen, Haoxu Wang et al.
TriMoE: Augmenting GPU with AMX-Enabled CPU for MoE Inference
Yudong Pan, Yintao He, Tianhua Han et al.
DynaMoE: Dynamic Token-Level Expert Activation for MoE
Gökdeniz Gülmez
Spectral Attention Steering for Prompt Highlighting
Weixian Waylon Li, Yuchen Niu, Yongxin Yang et al.

👥 作者关系图谱分析

以下展示了本月cs.AI论文中发表量最多的作者及其合作关系。节点大小表示论文数量，连线粗细表示合作频次。

5篇论文

4篇论文

3篇论文

其他活跃作者

主要合作团队

🔵 CMU/CMU-affiliated Team

Ding Zhao, Hao Zhang, H. Eric Tseng 等组成的核心团队，在自动驾驶、强化学习安全等领域有深入研究，本月共同发表5篇论文。

🟢 Milan/Bicocca Team

Federico Giannini, Giacomo Ziffer 等欧洲研究团队，专注于知识图谱、语义Web等方向，本月合作发表4篇论文。

🟡 Chongqing University Team

Hong Xie, Xiaoyu Shi, Mingsheng Shang 等组成的团队，在推荐系统公平性、强化学习等领域有重要贡献，合作发表3篇论文。

🔴 Microsoft Research Team

Qiyuan Zhang, Yufei Wang, Can Xu 等微软研究院团队，在大语言模型评估、生成式奖励模型等方向有深入研究。

💡 技术创新总结

🧠 智能体架构革新

分层规划成为LLM智能体研究热点。HiMAC提出宏观-微观学习框架，解决长时程任务中的错误传播问题。DeepResearch-9K构建大规模深度研究智能体评测基准，推动智能体能力边界拓展。

🔒 安全对齐新视角

Defensive Refusal Bias揭示了安全对齐的副作用——过度拒绝合法防御请求。Token-level Data Selection提出细粒度数据筛选策略，在保持安全性的同时最小化效用损失。Attention Smoothing提出基于注意力平滑的机器遗忘新范式。

⚡ MoE推理优化

TriMoE创新性地将AMX-Enabled CPU和DIMM-NDP相结合，实现高吞吐MoE推理。DynaMoE提出动态专家激活机制，突破传统Top-K路由的限制。SageBwd探索了INT8注意力机制的训练可行性。

🏥 医疗AI突破

MAMA-MIA Challenge聚焦乳腺癌MRI分割的泛化性与公平性。FCN-LLM首次将脑功能连接网络与LLM对齐，开辟神经影像分析新路径。TC-SSA解决了千兆像素病理图像的计算瓶颈。

📚 RAG与记忆机制

GAM-RAG提出增益自适应记忆机制，实现检索索引的动态演化。Semantic XPath引入树结构化记忆访问，提升对话AI的长期记忆能力。Modular Memory探索模块化记忆在持续学习中的关键作用。

🎮 强化学习前沿

Test-Time RL成为自演化推理模型的新范式，Tool Verification解决了共识验证问题。LTL约束集成到PPO中，为安全强化学习提供形式化保障。Multi-Task MBRL探索任务数量扩展优于样本扩展的新思路。

技术趋势洞察

📈 从规模化到精细化

研究焦点从单纯追求参数规模转向精细化优化：动态专家激活、token级数据选择、层次化规划等精细化策略成为主流。

🔗 跨模态深度融合

视觉-语言模型研究从简单的特征对齐发展到概念空间对齐，V-SONAR展示了统一嵌入空间的构建路径。

🛡️ 安全研究的范式转变

从被动防御转向主动保护，Contextualized Defense Instructing等研究展示了上下文感知的安全防护新思路。

🤖 智能体能力边界拓展

研究从简单任务执行扩展到复杂研究任务：DeepResearch-9K、MM-DeepResearch等基准推动智能体向更高级认知能力发展。

📄 精选重要论文

Defensive Refusal Bias: How Safety Alignment Fails Cyber Defenders

David Campbell, Neil Kale, Udari Madhushani Sehwag, Bert Herring, Nick Price, Dan Borges, Alex Levinson, Christina Q Knight

该论文揭示了LLM安全对齐的一个重要副作用：过度拒绝合法的网络安全防御请求。研究基于2,390个真实案例，系统分析了安全对齐在网络安全领域的不当应用，为改进安全对齐策略提供了重要见解。

Safety Alignment Cybersecurity LLM Refusal

DeepResearch-9K: A Challenging Benchmark Dataset of Deep-Research Agent

Tongzhou Wu, Yuhao Wang, Xinyu Ma, Xiuqiang He, Shuaiqiang Wang, Dawei Yin, Xiangyu Zhao

该研究构建了首个大规模深度研究智能体评测基准，包含9K个需要多步网络探索和深度推理的挑战性问题。同时提供了开源的数据合成和智能体训练框架，为推进智能体研究提供了重要基础设施。

LLM Agents Benchmark Deep Research

TriMoE: Augmenting GPU with AMX-Enabled CPU and DIMM-NDP for High-Throughput MoE Inference

Yudong Pan, Yintao He, Tianhua Han, Lian Liu, Shixin Zhao, Zhirong Chen, Mengdi Wang, Cangyuan Li, Yinhe Han, Ying Wang

该论文创新性地将AMX-Enabled CPU和DIMM-NDP技术与GPU协同，解决了大规模MoE模型推理中的计算瓶颈。通过区分冷、温、热专家的计算特性，实现了高效的异构计算资源调度。

MoE System Optimization Heterogeneous Computing

Modular Memory is the Key to Continual Learning Agents

Vaggelis Dorovatas, Malte Schwerin, Andrew D. Bagdanov, Lucas Caccia, Antonio Carta, Laurent Charlin, Barbara Hammer, Tyler L. Hayes, Timm Hess, Christopher Kanan, Dhireesha Kudithipudi, Xialei Liu, Vincenzo Lomonaco, Jorge Mendez-Mendez, Darshan Patil, Ameya Prabhu, Elisa Ricci, Tinne Tuytelaars, Gido M. van de Ven, Liyuan Wang, Joost van de Weijer, Jonghyun Choi, Martin Mundt, Rahaf Aljundi

该研究由持续学习领域的多位顶尖研究者联合发表，系统论证了模块化记忆是持续学习智能体的关键。提出了从权重学习到上下文学习的范式转变，为构建具有持续学习能力的AI系统提供了理论基础。

Continual Learning Modular Memory Foundation Models

The MAMA-MIA Challenge: Advancing Generalizability and Fairness in Breast MRI Tumor Segmentation

Lidia Garrucho, Smriti Joshi, Kaisar Kushibar et al. (47 authors)

该挑战赛汇集了乳腺癌MRI分割领域的最新进展，聚焦模型泛化性与公平性问题。基于多中心数据，系统评估了现有AI模型的局限性，为临床应用提供了重要参考。

Medical AI MRI Segmentation Fairness

Tool Verification for Test-Time Reinforcement Learning

Ruotong Liao, Nikolai Röhrich, Xiaohan Wang, Yuhui Zhang, Yasaman Samadzadeh, Volker Tresp, Serena Yeung-Levy

该论文解决了Test-Time RL中的共识验证问题，提出使用外部工具验证推理结果，避免了错误模式的崩溃。为自演化推理模型的可靠性提升提供了新思路。

Test-Time RL Reasoning Models Tool Verification

MOSAIC: A Unified Platform for Cross-Paradigm Comparison of Multi-Agent RL, LLM, VLM

Abdulhamid M. Mousa, Yu Fu, Rakhmonberdi Khajiev, Jalaledin M. Azzabi, Abdulkarim M. Mousa, Peng Yang, Yunusa Haruna, Ming Liu

MOSAIC是首个支持跨决策范式比较的统一平台，能够在相同环境中公平比较RL、LLM、VLM和人类决策者的行为。填补了多智能体研究基础设施的重要空白。

Multi-Agent Systems Benchmark Platform Cross-Paradigm

Egocentric Co-Pilot: Web-Native Smart-Glasses Agents for Assistive Egocentric AI

Sicheng Yang, Yukai Huang, Weitong Cai, Shitong Sun, Fengyi Fang, You He, Yiqiao Xie, Jiankang Deng, Hang Zhang, Jifei Song, Zhensong Zhang

该研究提出了一种基于智能眼镜的辅助AI框架，实现了无需屏幕、无需桌面的网络访问能力。通过神经符号框架结合LLM与感知、推理工具，为低视力用户和认知超载人群提供了创新解决方案。

Smart Glasses Assistive AI Egocentric Vision

🌏 Bluo Blog

关于本站

文章列表

数据统计

ARXIV CS AI WEEKLY 20260301