信息存储系统教育部重点实验室 English Version

博士生王霖的论文被会议CLUSTER 2025录用

点击次数:发布时间:2025-08-19 12:46作者:王霖

随着数据量爆炸式增长,重复数据删除技术在集群主存储系统中引入新碎片化问题,现有重写与超级块方案效果不佳。

华中科技大学信息存储及应用实验室硕士生王霖(第一作者)、硕士生毛世龙、博士生李茗畦、硕士生段梓羚等同学,在胡燏翀教授、秦磊华教授、冯丹教授的联合指导下,与华为合作提出ReoDedup1)利用余弦相似度算法(CSR)将高共享度块重定位;2)基于邻接表启发式算法(ATR)降低复杂度;3)设计索引重映射更新(IRU)缓解二次碎片。

实验团队在 Ceph 上实现了 ReoDedup。阿里云实验表明,与原生方案相比,ReoDedup读取吞吐量提升1.72倍,零损失重复数据删除率。

该研究被CLUSTER ’25CCF-B)录用,题目为:“Revisiting Fragmentation for Deduplication in Clustered Primary Storage Systems”。相关成果为集群主存储系统的高效管理提供了新思路,得到了国家自然科学基金(No.62272185)、深圳市科技创新计划(No.JCYJ20220530161006015)和教育部信息存储系统重点实验室的支持。

Top