信息存储系统教育部重点实验室 English Version

博士生张望的论文被期刊ACM TACO录用

点击次数:发布时间:2026-03-11 22:46作者:张望

异构对象存储(HOS)系统作为人工智能、大数据应用的核心存储支撑,通过整合NVMe SSD、HDD等不同性能等级存储设备实现成本与性能的平衡,已成为云存储领域主流架构。然而,设备间巨大性能差距与请求动态访问模式,导致传统副本选择与请求调度策略难以应对。现有方案多忽视设备异构特性与跨设备空间依赖(如性能耦合、干扰效应),易造成局部拥堵扩散为系统性瓶颈,引发服务级目标(SLO)违例,严重影响上层应用可靠性。

图1 STGraph3PO架构图

针对这一问题,信息存储系统教育部重点实验室博士生张望在施展副教授的指导下,提出了面向HOS系统服务质量保障的时空图学习框架STGraph3PO,实现精准预测、快速适配与风险可控的一体化解决方案。该框架三大核心创新突破传统瓶颈:将HOS系统建模为时空图,以节点表示存储设备、边编码功能依赖,通过图注意力网络(GAT)自适应学习节点交互权重捕捉设备异构性,结合门控循环单元(GRU)实现队列延迟精准预测;引入虚拟边机制,在同源节点间建立连接,加速属性传播与模型收敛;设计SLO感知的批量优化调度策略,精准识别高风险请求并避免级联违例。

实验结果表明,STGraph3PO在5个场景中SLO违约率较最优对比方案降低1.49个百分点,平均至P999尾延迟提升12.7%-26.3%;重载下P999尾延迟较PatchTST降低69.2%;训练峰值GPU内存仅1.12GB,远低于PatchTST的4.62GB,兼顾性能与部署可行性。

该研究工作题为“Supporting QoS Guarantee in Heterogeneous Object Storage System: A Spatio-Temporal Graph Data Processing Method”,已被国际顶级期刊ACM Transactions on Architecture and Code Optimization(ACM TACO)录用。ACM TACO 是并行与分布式系统领域的权威期刊,为中国计算机学会(CCF)推荐的A类期刊。据悉,该研究工作得到了国家重点研发计划(No.2023YFB4502701)和国家自然科学基金(No.61832020、61821003、U22A2027)等项目的资助。

Top