arXiv cs.OS 论文总结 (2025年9月)

arXiv cs.OS 论文研究总结 (2025年9月)

本文档总结了2025年9月在arXiv上提交的计算机操作系统(cs.OS)领域的重点研究论文,并按研究方向进行分类。

1. AI/ML 与操作系统集成

Towards Agentic OS: An LLM Agent Framework for Linux Schedulers

Authors: Yusheng Zheng, Yanpeng Hu, Wei Zhang, Andi Quinn

Summary: 为解决内核策略与应用需求之间的语义鸿沟,本文提出了SchedCP框架,使LLM Agent能够安全、高效地自主优化Linux调度器。该框架将优化问题分解为“目标推断”和“策略合成”,并通过一个稳定的接口提供工作负载分析、策略库和执行验证服务。实验表明,该框架性能提升高达1.79倍,成本降低13倍,是向自优化、应用感知操作系统迈出的一步。

MambaLite-Micro: Memory-Optimized Mamba Inference on MCUs

Authors: Hongjun Xu, Junxi Xia, Weisi Yang, Yueyuan Sui, Stephen Xia

Summary: 本文介绍了MambaLite-Micro,这是首个在资源受限的微控制器(MCU)上部署Mamba模型的纯C语言推理引擎。通过优化内存布局和算子融合,该引擎在保持极低数值误差的同时,将峰值内存使用量减少了83.0%,成功在ESP32和STM32等平台上实现了关键词识别等任务,为在嵌入式设备上应用高级序列模型铺平了道路。

Ratio1 -- AI meta-OS

Authors: Andrei Damian, Petrica Butusina, Alessandro De Franceschi, Vitalii Toderian, Marius Grigoras, Cristian Bleotiu

Summary: 本文提出了Ratio1 AI元操作系统(meta-OS),一个去中心化的MLOps协议,旨在将全球闲置的计算资源(笔记本、手机等)整合成一个无需信任的超级计算机。该系统通过区块链技术、同态加密联邦学习和去中心化容器编排等创新组件,确保AI管道在异构边缘设备上的安全、弹性执行,从而降低AI部署门槛和成本。

Secure and Efficient Access Control for Computer-Use Agents via Context Space

Authors: Haochen Gong, Chenxiao Li, Rui Chang, Wenbo Shen

Summary: 针对LLM Agent控制计算机带来的安全风险,本文提出了CSAgent,一个基于静态策略的系统级访问控制框架。CSAgent引入了意图和上下文感知的策略,并通过优化的OS服务来强制执行,确保Agent的行为符合用户意图和特定上下文。该框架能有效防御超过99.36%的攻击,而性能开销仅为6.83%。

2. 实时系统与性能优化

Towards Deterministic Sub-0.5 us Response on Linux through Interrupt Isolation

Authors: Zhouyi Zhou, Zhili Liu, Shancong Zhang, Jiemin Li, Dengke Du, Mengke Sun, Zhiqiang Wang, Hongyan Liu, Guokai Xu

Summary: 通过引入一种中断隔离方法,集中并最小化跨CPU核心的定时器中断干扰,该研究在Linux上实现了亚微秒级的响应延迟。实验表明,该机制能够持续实现低于0.5微秒的响应时间,优于传统的PREEMPT-RT配置。

A Task Equalization Allocation Algorithm Incorporating Blocking Estimation and Resource Similarity Analysis for Vehicle Control Real-Time Systems

Authors: Qianlong Duan, Bide Hao, Fan Zhou, Chen Fei, Shichun Yang

Summary: 针对多核实时车辆控制系统中的同步阻塞和资源竞争问题,本文提出了BR-WFD算法。该算法通过集成阻塞时间估计和资源相似性分析,最小化全局阻塞开销。仿真结果显示,在高负载下,该算法能将所需处理器核心减少11%至28%,并保持更高的可调度率。

3. 无服务器计算 (Serverless)

TrEnv: Transparently Share Serverless Execution Environments Across Different Functions and Nodes

Authors: Jialiang Huang, Teng Ma, Zheng Liu, Sixing Lin, Kang Chen, Jinlei Jiang, Xia Liao, Yingdi Shan, Yongwei Wu, Ning Zhang, Mengting Lu, Tao Ma, Haifeng Gong, Mingxing Zhang

Summary: 为解决LLM Agent等新兴工作负载在无服务器平台上的高昂基础设施开销,本文提出了TrEnv。该平台通过可重用沙箱和内存模板等技术,支持跨函数和节点的执行环境共享,从而显著降低启动延迟和内存使用。评估显示,TrEnv将P99延迟降低了高达7倍,内存使用减少了48%。

Taming Serverless Cold Starts Through OS Co-Design

Authors: Ben Holmes, Baltasar Dinis, Lana Honcharuk, Joshua Fried, Adam Belay

Summary: 本文挑战了“亚毫秒级冷启动需要内存驻留状态”的普遍观点,并提出Spice,一个专为无服务器快照/恢复构建的执行引擎。Spice通过与操作系统协同设计,直接恢复内核状态并引入专用原语高效恢复内存映射,从而实现了从磁盘恢复时的近乎热启动性能,延迟比现有技术降低了10倍以上。

4. 硬件与OS协同设计

XBOF: A Cost-Efficient CXL JBOF with Inter-SSD Compute Resource Sharing

Authors: Shushu Yi, et al.

Summary: 为解决JBOF中因I/O突发性导致的SSD计算资源未充分利用的问题,本文提出了XBOF。它通过CXL技术实现了SSD间的计算资源共享,空闲SSD的资源可以被繁忙的SSD用来加速处理。评估表明,XBOF能提高SSD资源利用率50.4%,节省19.0%的成本。

ASIC-based Compression Accelerators for Storage Systems: Design, Placement, and Profiling Insights

Authors: Tao Lu, Jiapin Wang, Yelin Shan, Xiangping Zhang, Xiang Chen

Summary: 本文设计了一款基于ASIC的存内压缩/解压缩处理单元(CDPU),并全面评估了其在不同部署位置(外设、片上、存内)的性能。研究揭示了CDPU的性能对放置位置、数据模式和互连方式高度敏感,并指出现有基准测试与真实应用加速效果之间存在差异,这些发现推动了对超大规模存储基础设施中硬件压缩的跨层重新思考。

A TRRIP Down Memory Lane: Temperature-Based Re-Reference Interval Prediction For Instruction Caching

Authors: Henry Kao, et al.

Summary: 针对移动CPU软件复杂的运行时行为导致指令缓存效率低下的问题,本文提出了一种名为TRRIP的软硬件协同设计方法。该方法使编译器能够根据代码的“温度”(热/冷)进行分类和转换,并通过OS接口向硬件提供这些信息以优化缓存替换策略。结果显示,TRRIP能将L2指令缓存的MPKI降低26.5%,带来3.9%的几何平均速度提升。

5. 操作系统核心架构与原语

μFork: Supporting POSIX fork Within a Single-Address-Space OS

Authors: John Alistair Kressel, Hugo Lefeuvre, Pierre Olivier

Summary: 本文提出了μFork,一种在单地址空间操作系统(SASOS)中支持POSIX fork原语的设计。μFork利用CHERI硬件能力解决了地址重定位和进程隔离的挑战,在保持轻量级优势的同时,实现了对多进程POSIX应用的兼容,其fork性能比传统操作系统快3.7倍。

6. 网络与I/O

Joyride: Rethinking Linux's network stack design for better performance, security, and reliability

Authors: Yanlin Du, Ruslan Nikolaev

Summary: 面对100 Gbps及以上高端网卡带来的挑战,传统Linux TCP/IP协议栈成为瓶颈。本文提出了Joyride,一个旨在替代Linux传统网络堆栈的高性能框架。Joyride计划集成内核旁路技术和用户空间TCP/IP堆栈,并设计一个微内核风格的架构,以实现低延迟、高吞吐和高可靠性。

A Target-Agnostic Protocol-Independent Interface for the Transport Layer

Authors: Pedro Mizuno, et al.

Summary: 本文认为,传输协议和其运行环境的多样性需要一个高级的、与目标无关的编程抽象。作者提出了一个名为TINF的框架,允许将传输协议指定为高级程序,从而减少开发工作量,并实现对传输层的自动分析和形式验证。

NetCAS: Dynamic Cache and Backend Device Management in Networked Environments

Authors: Joon Yong Hwang, Chanseo Park, Ikjun Yeom, Younghoon Kim

Summary: 在现代存储系统中,同时访问快速缓存和慢速后端设备可以提高吞吐量。本文提出了NetCAS框架,该框架根据实时网络反馈动态地在缓存和后端设备之间分配I/O请求。与传统缓存策略不同,NetCAS能适应工作负载和网络性能的变化,在远程存储环境中性能提升高达174%。

DBOS Network Sensing: A Web Services Approach to Collaborative Awareness

Authors: Sophia Lockton, et al.

Summary: 本文将高性能网络传感能力集成到DBOS(数据库操作系统)中,使DBOS Web服务能够协作创建对其网络环境的共享感知,以增强集体弹性和安全性。基准测试表明,增加网络传感功能的开销可以忽略不计,并且该协同感知能力可以线性扩展。

7. 安全与隔离

To Unpack or Not to Unpack: Living with Packers to Enable Dynamic Analysis of Android Apps

Authors: Mohammad Hossein Asghari, Lianying Zhao

Summary: 商业加壳工具(Packer)严重阻碍了对安卓应用的动态分析。本文提出了Purifire,一个基于eBPF的规避引擎,它能够在不脱壳的情况下绕过加壳工具的各种反分析技术。Purifire能够在用户空间保持不可见,从而显著提高对加壳应用的行为检测能力。

Exploiting Page Faults for Covert Communication

Authors: Sathvik Swaminathan

Summary: 本文提出了一种基于页错误(Page Fault)的新型隐蔽信道机制。通过利用内核在处理页错误时进行上下文切换的行为,一个恶意进程可以绕过操作系统的隔离机制,向另一个进程泄露秘密数据。这种攻击不依赖定时器且与硬件无关,实验证明其误码率低于4%。

Safe Sharing of Fast Kernel-Bypass I/O Among Nontrusting Applications

Authors: Alan Beadle, Michael L. Scott, John Criswell

Summary: 本文解决了在互不信任的应用程序间安全共享内核旁路I/O服务的几个关键挑战。通过将无界等待移出受保护的用户级库,并防止缓冲区取消映射攻击,该工作结合了内核旁路和微内核的优点,其原型相比商业实现,延迟降低约50%,吞吐量提高7倍。

总体总结

2025年9月的cs.OS研究论文全面展示了操作系统领域为应对现代计算挑战所做的多方面努力。一个核心主题是AI/ML与OS的深度融合,研究不再局限于为AI任务提供资源,而是探索使用LLM Agent主动优化系统行为(如调度),以及将AI模型部署到MCU等资源极度受限的环境中。另一个重要方向是应对硬件发展带来的变革,包括通过软硬件协同设计优化缓存、利用CXL等新互联技术重构存储架构,以及为超高速网络重新设计协议栈。同时,Serverless(无服务器计算)的性能瓶颈,特别是冷启动问题,正通过与OS的协同设计被逐步攻克,旨在实现真正的内存弹性和高性能。最后,安全领域的研究也愈发精细,从绕过商业加壳工具的动态分析,到利用页错误等底层机制构建隐蔽信道,再到确保内核旁路等高性能技术的安全共享,攻防两端都在不断演进。总体来看,操作系统正变得更加“智能”(Agentic)、更具适应性(Hardware-Aware)和更高效(Efficient),以支撑日益复杂的应用和异构的计算环境。