信息存储系统教育部重点实验室 English Version

博士生胡进磊的论文被会议ICCD 2025录用并入选Best Paper Candidates

点击次数:发布时间:2025-12-05 10:34作者:胡进磊

哈希结构提供了优异的点查询性能,被广泛应用于关键存储系统之中,例如键值存储引擎、内存缓存系统。持久内存 (PM) 兼具持久性和接近 DRAM 的性能,但同时也给哈希索引带来了新的挑战。现有的持久哈希设计优先考虑扩容操作,却牺牲了查询延迟,从而失去了哈希表的关键优势。

针对这一难题,实验室博士生胡进磊,以及硕士生陈波、张庙松,在冯丹教授、陈俭喜副教授的指导下提出了一种名为 R2Hash 的新型持久哈希索引,它基于持久缓存行哈希表重新设计,旨在平衡高读取性能和高效的扩容操作。R2Hash 由迁移规则指导,通过以下两项主要贡献同时实现了这两个目标:(i) 基于分裂规则的协作式低开销调整大小策略;(ii) 结合双层桶布局的移位感知搜索,实现了平均仅需一次 PM 访问的无锁读取。此外,R2Hash 还提供了无日志一致性和非阻塞恢复机制。

实验结果表明:与其他持久化哈希索引相比,R2Hash 的搜索吞吐量最高可提高 8.1 倍,插入吞吐量最高可提高 7.5 倍。将R2Hash移植到其他基于PM的键值存储系统中,在所有测试的持久内存键值存储中,R2Hash的DRAM使用率最低,同时读取性能接近最优。将经典缓存系统 Memcached 应用于 PM,并将其原始哈希索引结果替换为R2Hash。在测试工具 memtier 基准测试中,在 Memcached 中应用 R2Hash 后,与基于原始Memcached 相比,set/get 操作的性能分别提升了 1.15 倍/1.23 倍。

图1 R2Hash架构图

图2 不同负载下的吞吐量可拓展性对比图

图3 移植到真实缓存系统中对比图

该研究成果以“R2Hash: A Read-Optimized and Resize-Friendly Hashing Index for Persistent Memory”为题,发表在The 43rd IEEE International Conference on Computer Design (ICCD 2025) (CCF B类会议)上,并入选Best Paper Candidates。该研究由国家重点研发计划(编号:2024YFB4505104)和国家自然科学基金(编号:U22A2027)资助。

Top