李文明
- 作品数:115 被引量:44H指数:4
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金中国科学院战略性先导科技专项国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信文化科学更多>>
- 硬件筛选器、图神经网络加速器及其片外访存筛选方法
- 本发明提出一种硬件筛选器、图神经网络加速器及其片外访存筛选方法,该方法包含:接收来自图神经网络加速器内部的稀疏访存请求,并按照DRAM访问的最小单位burst对该稀疏访存请求分组为若干burst请求;对输入的所述若干bu...
- 孙弓箭严明玉吴萌李文明叶笑春范东睿
- 一种基于RISC-V扩展指令的矩阵及向量运算装置
- 本发明实施例提供一种基于RISC‑V扩展指令的矩阵及向量运算装置,所述装置包括相互连接的协处理器与主处理器,主处理器中配置有RISC‑V指令集和协处理器扩展指令集,RISC‑V指令集包括与向量运算任务相关的向量扩展指令集...
- 张志远李文明范志华安学军叶笑春范东睿
- 一种ECDSA算法执行系统及方法
- 本发明提供一种ECDSA算法执行系统及方法,主机端通过数据流芯片进行加密和解密操作,通过网络传输加密信息。本发明相比于现有技术,通过将ECDSA算法移植到数据流架构芯片上,利用了数据流架构芯片低访存需求的特点,加快了EC...
- 范志华 秦宏 吴欣欣李文明安学军叶笑春范东睿
- 文献传递
- NDP-Ledger:面向区块链应用的通用高通量加速架构
- 2020年
- 区块链技术由于去中心化及不可篡改等特性,广泛应用于数字货币、支付交易等领域,其算法对计算能力和存储访问能力有较高要求,导致传统冯诺依曼结构在面向区块链应用时能效比较低。3D堆叠存储器因可以缓解冯诺依曼结构的访存瓶颈,成为了热门研究方向之一。本文基于3D堆叠存储器技术及数据流执行模式,提出了一种面向区块链应用的高通量近数据处理(NDP)架构,NDP-Ledger。本文深入分析和论证了区块链应用的计算特征及3D堆叠存储技术在区块链应用中的适应性问题,并基于数据流执行模式设计了一种通用的高并发区块链加速体系结构,使区块链加速器在满足通用性的前提下提高处理性能。模拟评估结果表明,本文提出的区块链通用加速器结构,在典型区块链应用处理方面的性能优于主流的CPU和GPU。
- 安述倩李文明李文明范志华吴萌王达张浩王达
- 关键词:区块链数据流
- 一种异常事件自动推送及基于历史操作的监控方法及系统
- 本发明提出一种异常事件自动推送及基于历史操作的监控方法及系统,涉及监控室内视频墙智能显示领域,该方法包括获取多路视频流,对所述多路视频流进行编解码操作,生成与每路所述视频流相对应的图像帧,通过识别算法对所述图像帧进行异常...
- 李文明叶笑春孙凝晖范东睿王达马丽娜朱亚涛张洋
- 文献传递
- 一种多粒度数据流编译系统与数据流图编译方法
- 本发明提供了一种多粒度数据流编译系统的设计方案,该方案中仅需对编程语言进行数据流制导接口扩展,并在原有程序代码中添加相应数据依赖描述,以配置任务间数据依赖、任务优先级、任务与硬件绑定、迭代间及指令间数据依赖关系,达成任务...
- 刘钰李文明叶笑春
- 面向数据流结构的指令内访存冲突优化研究被引量:1
- 2019年
- 神经网络等人工智能应用的迅速兴起给传统处理器的设计带来了巨大的挑战,粗粒度数据流架构因具有高指令并发和高通用性的特点成为研究热点.然而,由于粗粒度数据流结构处理单元采用随机访问存储器作为存储结构,加之神经网络中大部分运算数据具有密集型特点,造成大量的指令内操作数访存冲突.通过分析典型神经网络的访存行为,发现此类应用存在指令内操作数冲突,会引起计算部件利用率的降低.基于此分析,提出了灵活的数据冗余策略.在编译指令阶段,为指令内有访存冲突的操作数申请数据冗余空间,降低指令内操作数访存延迟.实验以典型的神经网络LeNet,AlexNet为基准测试程序.采用灵活的数据冗余策略之后,能耗比相对于Round-Robin和ReHash的无数据冗余策略分别提高了30.21%和12.37%,相比于2套全数据冗余策略能耗比提高了27.95%.
- 欧焱冯煜晶李文明叶笑春王达范东睿
- 关键词:数据冗余能耗比
- 一种哈希硬件处理装置及方法
- 本发明提供一种基于阻变存储器的哈希硬件处理装置及方法,所有的源数据无需送往CPU进行哈希函数的计算,在RRAM中根据电流叠加效应即可完成哈希函数输入数据的操作,并在存储器中实现哈希表的建立,无需将大量的源数据送往CPU后...
- 李文明叶笑春安述倩姜志颖王晨晖范东睿
- 高密度片上网络的路网实现方法及装置
- 本发明提供了一种高密度片上网络的路网实现方法,适用于众核片上网络技术领域,包括:步骤1,将第一路由和第二路由的链路划分为多个低宽度的自治的子链路;步骤2,检测输入端口的数据包的队列,配置所述子链路和所述队列在同一时刻并行...
- 李文明孙凝晖谢向辉李宏亮郑方
- 文献传递
- 基于数据流架构的Stencil计算编译优化方法及电子设备
- 本发明提供了一种基于数据流架构的Stencil计算编译优化方法,采用在C语言中添加制导语句的方式编写Stencil程序,该语句用于明确Stencil计算类型和时间轴间数据依赖关系;编译器对制导语句进行解析,分析时间轴间的...
- 刘钰李文明叶笑春