随着闪存固态硬盘的存储单元密度和层数的增加,数据读取面临原始误码率不断攀升的问题。现有的基于低密度奇偶校验码(Low-Density Parity-Check Code,LPDC)的纠错码采用低码率或码率调整方案,面临高昂校验数据开销和跨页访问成本,难以兼顾冗余开销、读取性能和数据可靠性。
华中科技大学信息存储及应用实验室硕士生丁峥尧(第一作者)、硕士生王鼎鑫等,在李晓露讲师等的指导下,提出COLA框架:(1)基于码字故障感知的重读方案(Failure-aware Read-Retry,FR),利用页面码字译码失效分布特性,选择性传输并译码故障码字;(2)码字故障感知的译码方案(Failure-aware Decoding,FD),利用不同码字页面译码失效率特性,优化译码方案,减少无效读取延迟;(3)基于读取延迟模型的最优码长选择方案(Code Length Adaptation,COLA),建立码字故障感知机制联合优化的读取延迟模型,根据页面原始误码率预测读取延迟,动态选择最优码长。
实验团队基于开源SSD模拟器MQSim实现COLA原型。基于阿里云负载的实验表明,与闪存固态硬盘默认的4KiB码长LDPC方案相比,COLA的平均读取延迟最高降低了68.69%,P99.9尾延迟最高降低了71%,同时保持纠错码可靠性和码率不变,实现了冗余开销、读性能、可靠性的高效平衡。
该研究以“COLA: Enabling Low-latency Reads for Flash-based SSDs via Code Length Adaptation”为题被第63届设计自动化会议DAC’26(CCF-A,录用率22.3%)录用,为低冗余成本下维持纠错码可靠性并提高读取性能提供了新思路。研究工作得到了国家自然科学基金项目(No.62302175)和信息存储系统教育部重点实验室的支持。

图1 COLA系统架构示意图

图2 读取延迟对比试验结果

图3 各优化技术P99.9延迟试验结果