当前位置:首页  学术信息  学术讲堂

【问天科学讲坛(总第157场)】

作者: 访问量:503发布时间:2020-08-30

题   目:高容错自维护存储系统TStor                

报告人:郑纬民  中国工程院院士

时   间:2020年8月23日(周日)9:30

地   点:将军路校区一号楼10527室

承办单位:计算机科学与技术学院/人工智能学院、校科协

报告人简介:

        郑纬民,中国工程院院士,清华大学计算机系教授。长期从事高性能计算机体系结构、并行算法和系统研究。在高性能存储系统领域,提出可扩展的存储系统结构及轻量并行的扩展机制,发展了存储系统扩展性理论与方法,率先研制出具有自主知识产权的国产网络存储系统;提出高容错纠删码轻量编码方法及数据快速自愈模型,拓展了存储可靠性的技术思路。在高性能计算机体系结构领域,在国内率先研制并成功应用集群架构高性能计算机。在大规模并行算法与应用方面,在国产神威太湖之光上研制的极大规模天气预报应用获得ACM在计算扩展性方面的Gordon Bell奖。曾获国家科技进步一等奖1项、二等奖2项、国家技术发明二等奖1 项,何梁何利科技进步奖,获得首届中国存储终身成就奖。

报告简介:

        高容错自维护存储系统是指交付使用之后,在其生命周期内都能够提供正常的服务,不发生数据丢失,并且无需管理员进行维护的存储系统。报告首先介绍高容错存储系统目标和特征,接着详细介绍一种支持大规模纠删码的数据快速自愈的浮动数据块组织方法,通过物理磁盘、浮动数据块和文件系统三个层次,能够利用所有磁盘的IO带宽,恢复能力正比于磁盘的聚合带宽,恢复过程对应用程序的性能没有影响。介绍一系列提升大规模编解码性能的方法:通过多线程并行计算充分利用多核心的计算能力;使用AVX 2.0向量指令,提高单线程的编解码计算能力;通过计算、传输、存储重叠的方法充分利用所有的硬件资源,提高了磁盘的并行写入速度。在国际上首次设计实现了基于32+16纠删码的、满足实际应用需求的自维护存储系统TStor。

扫一扫进入直播平台


分享:
友情链接
网站说明