孙广宇
- 作品数:40 被引量:12H指数:3
- 供职机构:北京大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术理学电子电信更多>>
- 面向非易失内存的结构和系统级设计与优化综述
- 当今各类计算机应用都进入一个飞速发展的阶段,无论是'计算密集型'还是'存储密集型'应用都对存储系统的容量、性能以及功耗不断提出更高的要求.然而,由于传统内存工艺(DRAM)的发展落后于计算逻辑工艺(CMOS),基于DRA...
- 孙广宇舒继武王鹏
- 关键词:数据库技术系统级设计
- 文献传递
- 基于STT-RAM存储单元错误率分布的PUF认证方法
- 本发明公布了一种利用自旋矩传输随机读写器(STT-RAM)存储单元错误率分布的物理不可克隆认证方法,包括预处理阶段、注册阶段和验证阶段,包括步骤:首先在预处理阶段记录STT-RAM阵列中所有EDP的位置,然后在注册阶段输...
- 张宪孙广宇
- 文献传递
- PetS:针对参数高效Transformer模型的可扩展推理服务系统
- 2025年
- 在多任务推理服务场景下使用基于预训练-微调范式的Transformer模型存在很多困难:服务端必须维护每个下游任务的完整模型副本,从而造成很大的存储和显存开销.最近逐渐兴起的参数高效Transformer(PET)算法在不同的下游任务之间共享预训练模型,仅微调一小部分任务特定的模型参数,从而减少存储的开销.然而,现有的后端服务系统既没有灵活的PET任务管理机制,也不能有效地跨任务进行输入的批量处理.针对不同的下游任务,现有框架在多卡分布式场景下也难以提供良好的负载均衡机制.因此,提出了PetS,一个用于多任务PET推理服务的可扩展框架.具体而言,不同的PET任务在算法上被抽象成一种统一表示形式.基于这种统一表示,设计了一个专门的PET推理引擎,以批处理不同任务的输入,并使用任务无关的共享算子和任务特定的PET算子进行推理.通过PET推理引擎,PetS在单个GPU设备上可以支持更多的任务数量.为了进一步提高系统吞吐量,提出了一种协同批处理(CB)策略,同时考虑了输入的长度、PET任务类型以及系统负载平衡.为了提升多卡部署的负载均衡,创新性地提出了基于PET实时迁移的负载均衡机制.PetS在包括边缘端、桌面端和服务器端GPU等多个平台上都经过了评估.全面的实验证明,PetS支持多达26倍的并发任务,并将服务吞吐量在桌面和服务器GPU节点上分别提高了1.53倍和1.63倍.在多GPU场景下,该负载均衡策略可以将吞吐量进一步提升29%之多.
- 魏学超周哲徐盈辉张洁靖谢源孙广宇
- 关键词:GPU分布式系统机器学习系统
- 一种基于强化学习的内存地址映射方法
- 本发明公布了一种基于强化学习的内存地址映射方法,建立基于地址映射矩阵BIM交换的强化学习神经网络模型,并使用策略梯度的方法有效地训练模型,通过强化学习对不同的程序自动找到内存地址映射。采用本发明提供方法,可以对不同的程序...
- 孙广宇李星辰
- 文献传递
- 针对Path ORAM的叉型访问方法
- 本发明公布了一种针对Path?ORAM的叉型访问方法,包括:地址请求队列ARQ处理末级缓存请求LLC阶段、标签请求队列LRQ处理地址请求队列ARQ请求的阶段、地址转换逻辑处理标签请求队列LRQ请求的阶段,MAC处理地址转...
- 孙广宇张宪张超张玮其
- 文献传递
- 一种基于亚阈值电流的磁畴壁移动控制方法及其电路
- 本发明公布了一种基于亚阈值电流的磁畴壁移动控制方法及其电路,该方法将小于阈值的电流称为亚阈值电流,通过所述亚阈值电流推动磁畴壁在锚定区域外移动,作为控制磁畴壁移动位置的补充;包括单步移动模式和多步移动模式,依次包括步骤:...
- 孙广宇张超张宪张炜其
- 文献传递
- 一种大语言模型软硬件协同量化加速计算方法及系统
- 本发明公布了一种大语言模型软硬件协同量化加速计算方法及系统,采用以通道为粒度处理大语言模型中的离群值,将存在大量离群值的通道整体以高精度进行存储,通过自适应量化过程、编译优化过程和硬件实现过程,实现大语言模型软硬件协同推...
- 孙广宇薛晨皓
- 一种基于配额控制温度的赛道存储芯片及其控制方法
- 本发明公开了一种基于配额控制温度的赛道存储芯片及其控制方法。本发明的赛道存储芯片包括:衬底、赛道存储条、填充层和散热装置;本发明在一个程序运行区间内设置移动配额,从而从时间上进行热点分散;并且,将一个数据块存储在互不相邻...
- 孙广宇张超
- 文献传递
- 一种基于混合内存系统的故障快速恢复方法
- 本发明公布了一种基于混合内存系统的故障快速恢复方法,混合内存系统为动态随机存取存储器DRAM和非易失性存储器NVM的混合内存系统;在混合内存系统的DRAM和NVM中各自维护一个进程栈空间;设定新的函数限定符,针对使用该新...
- 孙广宇 肖侬 吕宝财王晓阳
- 文献传递
- 基于DRAM-PIM查表式神经网络推理与调优的文本分类方法及系统
- 本发明公布了一种基于DRAM‑PIM查表式神经网络推理与调优的文本分类方法及系统,包括宿主处理器、控制器和存内计算PIM模块;基于DRAM存内计算架构,通过设计查表式神经网络LUT‑NN算法的算子,实现算法的高效推理,进...
- 孙广宇李聪