近日,我院3篇论文被计算机体系结构四大顶会之一的IEEE International Symposium on High Performance Computer Architecture(HPCA)录用,3篇论文均来自厦门市智能存储与计算重点实验室。HPCA 2024录用75篇,接收率为18%,录用论文简要介绍如下:
1.Mitigating Write Disturbance in Non-Volatile Memory via Coupling Machine Learning with Out-of-Place Updates
内存技术已经逐渐接近其物理极限,这使得传统的DRAM难以满足海量数据存储需求。非易失性存储器(Non-Volatile Memory, NVM)为解决内存容量限制提供了新的机会,但仍受到写干扰(Write Disturbance, WD)问题的困扰。写干扰问题是指写入时错误地转换了NVM内存单元的数据,将会降低内存可靠性,并影响内存访问性能。此外,现有研究认为简单地缩小单元间的距离来追求更高的NVM内存容量,会使得写干扰问题更为严峻,进一步阻碍NVM的广泛部署。现有研究主要关注本地更新的情况下,如何利用编码方案减少易出现写干扰的数据模式来缓解写干扰问题。沈志荣老师团队分析发现,通过异地更新的方式进行写入时,能够进一步减少NVM的写干扰错误。为了合理利用异地更新的方式,该论文提出LearnWD,这是第一个基于机器学习来管理旧数据块(例如,逻辑删除数据或无效数据)以缓解NVM的写干扰问题的工作。LearnWD使用聚类算法将旧数据块划分为多个类别,使得每个类别包含具有类似写干扰倾向的旧数据块。当发起新的写入请求时,其首先提取新数据块的攻击倾向分布(即可能导致写干扰错误的位)。然后,通过耦合旧数据块的错误倾向分布和新数据块的攻击倾向分布,以确定一个适当的旧数据块进行覆盖写,从而推测性地减少由内存写入引发的写干扰错误。最后,LearnWD通过重训练以维持模型的准确性和高效性。
LearnWD的设计概览
论文第一作者是计算机科学与技术系2021级硕士生吴镕龙,通讯作者是沈志荣副教授,由计算机科学与技术系2022级硕士生杨志伟、舒继武教授合作完成。
2. LearnedFTL: A Learning-based Page-level FTL for Reducing Double Reads in Flash-based SSDs
随着3D NAND和NVMe技术的崛起,固态硬盘(SSD)的容量和性能大幅提升。然而,在SSD的闪存转换层(FTL)中存储所有地址映射表需要大量内存,在闪存中存储则会导致“双读”问题,严重影响读性能。为了解决这一问题,主流的需求驱动型FTL(DFTL、TPFTL等)利用工作负载的局部性缓存映射以减少双读现象的发生。然而,面对随机读取场景时,这些方案依然面临双读瓶颈。为了解决这一问题,论文提出了LearnedFTL,将学习索引与需求驱动型FTL结合,保证处理局部性工作负载能力的同时增强随机读性能。LearnedFTL以可调参数的分段线性模型为基础,建立就地更新线性模型摆脱对工作负载局部性的依赖,并通过虚拟物理地址表示法在保证并行性的同时满足学习索引的训练需求。同时,LearnedFTL提出了基于组的分配策略减少模型的空间开销,利用垃圾回收训练模型最小化训练开销,还通过一系列措施进一步提高模型准确性。实验表明,与现有的FTL方案相比,LearnedFTL的P99尾延迟可以减少5.3到12.2倍,随机读场景下,双读残留可以减少55%。这项研究为提高SSD性能,特别是在处理随机读取时,提供了一种创新解决方案。
LearnedFTL系统架构
该论文第一作者是我院2020级硕士生王圣哲,共同通讯作者是吴素贞副教授和毛波教授,由2021级硕士生林子航、德克萨斯大学阿灵顿分校江泓教授和北京大学张杰助理教授共同合作完成。
3.Turning Waste into Gold: Invalid-Data Assisted Reliability and Performance Boost for 3D High-Density Flash
随着海量数据对计算机存储密度与容量的需求持续增加,三星、美光和长江存储等近两年相继推出200层3D堆叠闪存芯片,并采用4比特每存储元的QLC(Quad-Level Cell)技术。由于制程工艺的限制,3D QLC采用一种全新的编程方式,即基于字线(Wordline)粒度(4个物理页同时编程)的两步编程(粗略编程和精细编程)方式。李乔老师所在团队在今年HotStorage论文中首次指出3D QLC的两步编程方式中,存在对无效数据页的编程,将其定义为无效编程问题。针对该问题,本文首次提出系统的解决方案,利用无效页的存在实现有效页的高效编程,在不改变闪存芯片硬件的前提下,最小化由无效编程产生的能耗和性能损耗,并提升有效页的可靠性。论文提出了三个无效数据辅助策略来提升有效数据的写入性能和可靠性。论文首先提出了一种对有效数据进行重新组织编程的方案,避免对无效数据的精细编程操作,缩短编程的时间,提升写入性能。其次,论文提出了非编程方案,利用Wordline中存在的无效页,改变精细编程步骤中的数据,提升了有效页的可靠性。最后,论文基于最新的混合SSD,设计出了SLC(Single-Level Cell)和QLC区域之间的动态数据管理和自适应数据分配策略,减少了无效编程的发生。基于真实芯片和模拟器的评估表明,所提出的策略对3D QLC可靠性、性能和能耗均有较大的提升。
整体设计流程示例
论文第一作者是李乔副教授,通讯作者是高聪明副教授,由计算机科学与技术系2022级硕士生党红洋、2022级硕士生万峥、博士生叶敏(香港城市大学)、张杰助理教授(北京大学)、郭大维教授(台湾大学)、薛春教授(香港城市大学)合作完成。
投稿:李乔