李胜国
- 作品数:2 被引量:7H指数:1
- 供职机构:国防科学技术大学计算机学院并行与分布处理国家重点实验室更多>>
- 发文基金:国家自然科学基金国防科技重点实验室基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 后摩尔时代国产高性能并行应用软件生态建设综述被引量:7
- 2022年
- 国产高性能计算(high performance computing,HPC)系统研制世界领先、芯片架构百花齐放,系统运营依托国家超算中心形成良好发展态势。国产高性能并行应用在若干关键技术点方面世界领先,应用支撑环境发展迅速,但工业软件和队伍建设挑战巨大。在后摩尔时代,需要立足人类文明进步来推动并行应用软件生态建设,工业软件要从产品角度全方面与国外商业软件进行对标;重点关注应用软件云、软硬件协同优化、面向领域的定制芯片架构和定制编译技术;在开源模式、知识产权保护和人才评价方面要与时俱进,从制度上促进应用软件生态的繁荣。
- 龚春叶刘杰包为民潘冬梅甘新标李胜国陈旭光肖调杰杨博王睿伯
- 关键词:软硬件协同
- FitenBLAS:面向FT1000微处理器的高性能线性代数库
- 2015年
- BLAS库是基本线性代数子程序库,是许多大型科学与工程计算的核心计算程序,FitenBLAS库是在多核多线FT1000微处理器上开发的基本线性代数库,其研制对FT1000微处理器在科学与工程计算中的应用具有重要意义.根据多级存储结构和寄存器的数目,设计了向量与向量、矩阵与向量和矩阵与矩阵运算的多级循环展开方法,采用指令调度、数据预取等通用优化技术,优化BLAS库串行程序.对于BLAS3子程序,设计了矩阵乘无冗余数据拷贝分块算法,采用指令重排、访存与计算的重叠、分块等技术优化矩阵乘子程序,基于矩阵乘子程序实现了其他BLAS3子程序.研制了汇编线性代数程库FitenBLAS,其核心子程序矩阵乘的双精度计算性能达到6.91Gflops,是峰值性能的86.4%.
- 迟利华刘杰晏益慧谢林川甘新标胡庆丰蒋杰李胜国