您的位置: 专家智库 > >

吕鹏伟

作品数:4 被引量:11H指数:2
供职机构:西安微电子技术研究所更多>>
发文基金:国家自然科学基金国家科技重大专项国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 4篇中文期刊文章

领域

  • 4篇自动化与计算...
  • 1篇电子电信

主题

  • 2篇自动向量化
  • 2篇向量
  • 2篇向量化
  • 1篇调度
  • 1篇调度方法
  • 1篇动态规划
  • 1篇多核
  • 1篇多核处理
  • 1篇多核处理器
  • 1篇任务调度
  • 1篇任务调度方法
  • 1篇嵌入式
  • 1篇嵌入式系统
  • 1篇复用
  • 1篇编译器
  • 1篇SIMD指令
  • 1篇GCC编译器
  • 1篇处理器

机构

  • 4篇西安微电子技...

作者

  • 4篇吕鹏伟
  • 3篇刘从新
  • 3篇沈绪榜
  • 1篇袁成军
  • 1篇贺骊
  • 1篇赵一明

传媒

  • 1篇武汉大学学报...
  • 1篇微电子学与计...
  • 1篇北京理工大学...
  • 1篇现代电子技术

年份

  • 2篇2017
  • 1篇2016
  • 1篇2012
4 条 记 录,以下是 1-4
排序方式:
一种新型自动向量化编译算法
2016年
SIMD(single instruction multiple data)体系结构在高性能计算与嵌入式多媒体计算中扮演着重要的角色,对于SIMD指令的自动向量化编译技术是当前编译领域的研究热点.本文基于超字并行(super-word level parallelism,SLP)算法提出了一种新的自动向量化算法GSLP(global super-word level parallelism),该算法分为两部分:语句分组和语句调度.语句分组从全局出发分析超字复用信息,在语句分组的过程中,充分挖掘基本块的直接或者间接的超字复用信息,提高基本块内语句并行操作的机会;语句调度对基本块内的所有语句进行调度并调整超字内部单字(Single-word)数据的组织顺序,使生成的代码中打包/解包(pack/unpack)操作的数量降到最低.使用16个测试程序对GSLP算法进行测试,试验结果表明该算法使打包/解包操作的数量平均减少了41.6%,与SLP算法所产生的加速相比平均提高了4.7%.
吕鹏伟刘从新沈绪榜
关键词:SIMD指令自动向量化
基于动态规划的自动向量化方法被引量:1
2017年
由于SLP自动向量化算法使用的启发式策略会丢失一定的向量化机会,本文提出一种基于动态规划的自动向量化方法DPSLP,该方法采用比SLP更加激进的策略在基本块内寻找候选的SIMD指令分组,依据动态规划方程计算指令分组的代价并从众多指令分组中选择最优的分组进行向量化转换.实验结果显示,DPSLP与SLP相比测试程序的运行时间平均减少了8%,静态指令代价平均减少10%,平均向量宽度增加66.4%.
吕鹏伟刘从新赵一明沈绪榜
关键词:自动向量化动态规划
一种面向嵌入式多核系统的任务调度方法被引量:6
2017年
针对嵌入式多核处理器资源有限的特点,提出了一种基于软件流水的任务调度方法.该调度方法使用整数线性规划方程对软件流水中的工作负载、通信开销和存储空间进行建模,通过实现多核处理器的负载均衡、减少核间通信开销和优化存储空间的使用来提高程序的性能.最终在Revealer处理器上进行实验,实验表明该调度方法相对于其他任务调度方法,程序性能获得不同程度的提高,能够更好地适应于嵌入式多核处理器.
吕鹏伟刘从新沈绪榜
关键词:嵌入式系统多核处理器任务调度
GCC编译器后端移植技术被引量:4
2012年
从GCC编译器的体系结构出发,提出了GCC前后端分离的结构以适合移植到不同的硬件平台,分析了GCC后端移植的关键技术。重点阐述后端移植所必须的文件,并详细说明这些文件的作用,给出了RTL中间语言的语法结构以及典型指令的RTL指令模板结构。最后通过一个实例对移植到新硬件体系结构的GCC进行测试,结果表明针对特定的硬件体系结构,GCC后端移植技术是可行的,能够产生正确的汇编语言代码。
吕鹏伟袁成军贺骊
共1页<1>
聚类工具0