arXiv cs.AI 周报 (20260301)
📚 共 527 篇论文 📅 时间范围: 2026年2月23日 ~ 2026年3月1日 🏷️ 分类: cs.AI

📊 研究方向热度分析

🤖 LLM Agents 154篇

大模型智能体是本月最热门研究方向,涵盖多步推理、工具调用、自主决策等核心能力。

🎮 Reinforcement Learning 200篇

强化学习研究热度最高,涵盖策略优化、安全RL、多任务学习等前沿方向。

👁️ Vision-Language Models 64篇

视觉语言模型研究持续活跃,关注多模态对齐、跨模态推理等关键问题。

🛡️ Safety & Alignment 66篇

安全与对齐研究关注模型安全、隐私保护、对抗攻击防御等关键议题。

🏥 Medical AI 31篇

医疗AI研究涵盖影像诊断、病理分析、蛋白质功能预测等临床应用。

📚 RAG & Memory 152篇

检索增强生成与记忆机制研究蓬勃发展,关注动态索引、结构化存储等。

🎨 Diffusion Models 27篇

扩散模型研究涵盖离散扩散语言模型、逆向问题求解、运动规划等方向。

🔗 Graph Neural Networks 57篇

图神经网络研究关注可解释性、持续学习、异构图处理等核心问题。

🦾 Robotics & Embodied AI 87篇

机器人与具身智能研究涵盖导航、操控、人机交互等关键应用场景。

⚡ Efficiency & Optimization 86篇

效率优化研究关注量化、剪枝、推理加速等模型压缩与部署技术。

👥 作者关系图谱分析

以下展示了本月cs.AI论文中发表量最多的作者及其合作关系。节点大小表示论文数量,连线粗细表示合作频次。

作者合作关系网络 Ding Zhao Hao Zhang H.E. Tseng Federico Giannini Giacomo Ziffer Zhiguang Cao Xi Chen Hong Xie Xiaoyu Shi Mingsheng Shang Qiyuan Zhang Yufei Wang Can Xu Peng Zhao Rui Cao Xiangyu Zhao Jun Wang Cheng Yang 图例说明 5篇论文 4篇论文 3篇论文 合作连线
5篇论文
4篇论文
3篇论文
其他活跃作者

主要合作团队

🔵 CMU/CMU-affiliated Team

Ding Zhao, Hao Zhang, H. Eric Tseng 等组成的核心团队,在自动驾驶、强化学习安全等领域有深入研究,本月共同发表5篇论文。

🟢 Milan/Bicocca Team

Federico Giannini, Giacomo Ziffer 等欧洲研究团队,专注于知识图谱、语义Web等方向,本月合作发表4篇论文。

🟡 Chongqing University Team

Hong Xie, Xiaoyu Shi, Mingsheng Shang 等组成的团队,在推荐系统公平性、强化学习等领域有重要贡献,合作发表3篇论文。

🔴 Microsoft Research Team

Qiyuan Zhang, Yufei Wang, Can Xu 等微软研究院团队,在大语言模型评估、生成式奖励模型等方向有深入研究。

💡 技术创新总结

🧠 智能体架构革新

分层规划成为LLM智能体研究热点。HiMAC提出宏观-微观学习框架,解决长时程任务中的错误传播问题。DeepResearch-9K构建大规模深度研究智能体评测基准,推动智能体能力边界拓展。

🔒 安全对齐新视角

Defensive Refusal Bias揭示了安全对齐的副作用——过度拒绝合法防御请求。Token-level Data Selection提出细粒度数据筛选策略,在保持安全性的同时最小化效用损失。Attention Smoothing提出基于注意力平滑的机器遗忘新范式。

⚡ MoE推理优化

TriMoE创新性地将AMX-Enabled CPU和DIMM-NDP相结合,实现高吞吐MoE推理。DynaMoE提出动态专家激活机制,突破传统Top-K路由的限制。SageBwd探索了INT8注意力机制的训练可行性。

🏥 医疗AI突破

MAMA-MIA Challenge聚焦乳腺癌MRI分割的泛化性与公平性。FCN-LLM首次将脑功能连接网络与LLM对齐,开辟神经影像分析新路径。TC-SSA解决了千兆像素病理图像的计算瓶颈。

📚 RAG与记忆机制

GAM-RAG提出增益自适应记忆机制,实现检索索引的动态演化。Semantic XPath引入树结构化记忆访问,提升对话AI的长期记忆能力。Modular Memory探索模块化记忆在持续学习中的关键作用。

🎮 强化学习前沿

Test-Time RL成为自演化推理模型的新范式,Tool Verification解决了共识验证问题。LTL约束集成到PPO中,为安全强化学习提供形式化保障。Multi-Task MBRL探索任务数量扩展优于样本扩展的新思路。

技术趋势洞察

📈 从规模化到精细化

研究焦点从单纯追求参数规模转向精细化优化:动态专家激活、token级数据选择、层次化规划等精细化策略成为主流。

🔗 跨模态深度融合

视觉-语言模型研究从简单的特征对齐发展到概念空间对齐,V-SONAR展示了统一嵌入空间的构建路径。

🛡️ 安全研究的范式转变

从被动防御转向主动保护,Contextualized Defense Instructing等研究展示了上下文感知的安全防护新思路。

🤖 智能体能力边界拓展

研究从简单任务执行扩展到复杂研究任务:DeepResearch-9K、MM-DeepResearch等基准推动智能体向更高级认知能力发展。

📄 精选重要论文

📊 数据来源: arXiv cs.AI 分类 | 📅 统计时间: 2026年3月 | 🤖 报告生成: AI辅助分析