信息存储系统教育部重点实验室 English Version

博士生胡进磊的论文被期刊TACO录用

点击次数:发布时间:2025-12-05 10:40作者:胡进磊

主机端仅追加写的分区接口(Zone interface)为现有的键值存储 (KVS) 提供了新的机遇,尤其是在降低闪存层写放大方面。然而现有工作主要集中于利用分区接口来优化基于 LSM 树的 KVS,而忽视了基于 B+ 树的 KVS 的潜在提升空间。

实验室博士生胡进磊、陈波,以及硕士生张庙松,在冯丹教授、陈俭喜副教授的指导下,在通过深入的实验观察发现了基于 B+ 树的 KVS 的三个关键机遇:卓越的读取性能、对闪存友好的追加操作以及直接管理闪存介质的能力。然而,现有的专为块 SSD 设计的基于 B+ 树的 KVS 依赖于低效的文件系统层来适应特殊的区域接口,并通过严重牺牲读取性能来降低写放大。

博士生胡进磊提出了一种针对写入优化的基于 B+ 树的键值存储 ZKV,旨在通过分区接口最大限度地减少写放大,同时又不牺牲读取性能。ZKV 采用三级缓冲区结构,使其核心索引结构 Z+-Tree 能够高效利用分区接口,其中包括树级合并过滤器、叶级自适应增量缓冲区以及高效的分区级管理模块 ZFlusher。通过三级缓冲区结构,Z+-Tree 能够有效地利用分区接口,将小尺寸随机写入操作转换为对闪存友好的大块追加操作。

在 ZNS SSD 设备上进行的评估表明,在 YCSB 工作负载下,ZKV 的插入/读取吞吐量比当前基于B+-Tree 的键值存储系统高出 3.12 倍/2.53 倍。在另外三个真实工作负载下,ZKV 的写入性能与基于 LSM-Tree 的 RocksDB 相当,而读取性能则与基于 B+-Tree 的 WiredTiger 相当。

图1 ZKV架构图

图2 不同负载下的吞吐量性对比图

图3 与主流键值存储在真实负载下性能对比图

该研究成果以“Co-design of B+-Tree Index with Emerging Zone Interfaces for Small-sized Key-Value Pairs”为题,发表在ACM Transactions on Architecture and Code Optimization (CCF A类期刊)。该研究由国家重点研发计划(编号:2024YFB4505104)和国家自然科学基金(编号:U22A2027)资助。

Top