您的位置: 专家智库 > >

孙广宇

作品数:40 被引量:12H指数:3
供职机构:北京大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术理学电子电信更多>>

文献类型

  • 32篇专利
  • 5篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 21篇自动化与计算...
  • 1篇电子电信
  • 1篇理学

主题

  • 12篇内存
  • 9篇硬件
  • 6篇软硬件
  • 6篇软硬件协同
  • 6篇赛道
  • 5篇分布式
  • 4篇电路
  • 4篇语言模型
  • 4篇网络
  • 4篇芯片
  • 4篇DRAM
  • 3篇映射
  • 3篇神经网
  • 3篇神经网络
  • 3篇请求
  • 3篇网络模型
  • 3篇分布式系统
  • 3篇存储器
  • 2篇带宽
  • 2篇单步

机构

  • 39篇北京大学
  • 2篇清华大学
  • 1篇复旦大学
  • 1篇北京航空航天...
  • 1篇香港科技大学
  • 1篇中兴通讯股份...

作者

  • 39篇孙广宇
  • 8篇张超
  • 7篇张宪
  • 6篇王晓阳
  • 5篇李聪
  • 4篇李星辰
  • 4篇周哲
  • 2篇杨雅辉
  • 2篇舒继武
  • 2篇孟彤
  • 1篇吴中海
  • 1篇屠要峰
  • 1篇张学莹
  • 1篇张超
  • 1篇王鹏

传媒

  • 3篇计算机研究与...
  • 1篇华东师范大学...
  • 1篇北京大学学报...
  • 1篇华东师范大学...

年份

  • 1篇2025
  • 10篇2024
  • 4篇2023
  • 1篇2022
  • 4篇2021
  • 5篇2020
  • 2篇2018
  • 4篇2017
  • 2篇2016
  • 3篇2015
  • 2篇2014
  • 1篇2012
40 条 记 录,以下是 1-10
排序方式:
面向非易失内存的结构和系统级设计与优化综述
当今各类计算机应用都进入一个飞速发展的阶段,无论是'计算密集型'还是'存储密集型'应用都对存储系统的容量、性能以及功耗不断提出更高的要求.然而,由于传统内存工艺(DRAM)的发展落后于计算逻辑工艺(CMOS),基于DRA...
孙广宇舒继武王鹏
关键词:数据库技术系统级设计
文献传递
基于STT-RAM存储单元错误率分布的PUF认证方法
本发明公布了一种利用自旋矩传输随机读写器(STT-RAM)存储单元错误率分布的物理不可克隆认证方法,包括预处理阶段、注册阶段和验证阶段,包括步骤:首先在预处理阶段记录STT-RAM阵列中所有EDP的位置,然后在注册阶段输...
张宪孙广宇
文献传递
PetS:针对参数高效Transformer模型的可扩展推理服务系统
2025年
在多任务推理服务场景下使用基于预训练-微调范式的Transformer模型存在很多困难:服务端必须维护每个下游任务的完整模型副本,从而造成很大的存储和显存开销.最近逐渐兴起的参数高效Transformer(PET)算法在不同的下游任务之间共享预训练模型,仅微调一小部分任务特定的模型参数,从而减少存储的开销.然而,现有的后端服务系统既没有灵活的PET任务管理机制,也不能有效地跨任务进行输入的批量处理.针对不同的下游任务,现有框架在多卡分布式场景下也难以提供良好的负载均衡机制.因此,提出了PetS,一个用于多任务PET推理服务的可扩展框架.具体而言,不同的PET任务在算法上被抽象成一种统一表示形式.基于这种统一表示,设计了一个专门的PET推理引擎,以批处理不同任务的输入,并使用任务无关的共享算子和任务特定的PET算子进行推理.通过PET推理引擎,PetS在单个GPU设备上可以支持更多的任务数量.为了进一步提高系统吞吐量,提出了一种协同批处理(CB)策略,同时考虑了输入的长度、PET任务类型以及系统负载平衡.为了提升多卡部署的负载均衡,创新性地提出了基于PET实时迁移的负载均衡机制.PetS在包括边缘端、桌面端和服务器端GPU等多个平台上都经过了评估.全面的实验证明,PetS支持多达26倍的并发任务,并将服务吞吐量在桌面和服务器GPU节点上分别提高了1.53倍和1.63倍.在多GPU场景下,该负载均衡策略可以将吞吐量进一步提升29%之多.
魏学超周哲徐盈辉张洁靖谢源孙广宇
关键词:GPU分布式系统机器学习系统
一种基于强化学习的内存地址映射方法
本发明公布了一种基于强化学习的内存地址映射方法,建立基于地址映射矩阵BIM交换的强化学习神经网络模型,并使用策略梯度的方法有效地训练模型,通过强化学习对不同的程序自动找到内存地址映射。采用本发明提供方法,可以对不同的程序...
孙广宇李星辰
文献传递
针对Path ORAM的叉型访问方法
本发明公布了一种针对Path?ORAM的叉型访问方法,包括:地址请求队列ARQ处理末级缓存请求LLC阶段、标签请求队列LRQ处理地址请求队列ARQ请求的阶段、地址转换逻辑处理标签请求队列LRQ请求的阶段,MAC处理地址转...
孙广宇张宪张超张玮其
文献传递
一种基于亚阈值电流的磁畴壁移动控制方法及其电路
本发明公布了一种基于亚阈值电流的磁畴壁移动控制方法及其电路,该方法将小于阈值的电流称为亚阈值电流,通过所述亚阈值电流推动磁畴壁在锚定区域外移动,作为控制磁畴壁移动位置的补充;包括单步移动模式和多步移动模式,依次包括步骤:...
孙广宇张超张宪张炜其
文献传递
一种大语言模型软硬件协同量化加速计算方法及系统
本发明公布了一种大语言模型软硬件协同量化加速计算方法及系统,采用以通道为粒度处理大语言模型中的离群值,将存在大量离群值的通道整体以高精度进行存储,通过自适应量化过程、编译优化过程和硬件实现过程,实现大语言模型软硬件协同推...
孙广宇薛晨皓
一种基于配额控制温度的赛道存储芯片及其控制方法
本发明公开了一种基于配额控制温度的赛道存储芯片及其控制方法。本发明的赛道存储芯片包括:衬底、赛道存储条、填充层和散热装置;本发明在一个程序运行区间内设置移动配额,从而从时间上进行热点分散;并且,将一个数据块存储在互不相邻...
孙广宇张超
文献传递
一种基于混合内存系统的故障快速恢复方法
本发明公布了一种基于混合内存系统的故障快速恢复方法,混合内存系统为动态随机存取存储器DRAM和非易失性存储器NVM的混合内存系统;在混合内存系统的DRAM和NVM中各自维护一个进程栈空间;设定新的函数限定符,针对使用该新...
孙广宇 肖侬 吕宝财王晓阳
文献传递
基于DRAM-PIM查表式神经网络推理与调优的文本分类方法及系统
本发明公布了一种基于DRAM‑PIM查表式神经网络推理与调优的文本分类方法及系统,包括宿主处理器、控制器和存内计算PIM模块;基于DRAM存内计算架构,通过设计查表式神经网络LUT‑NN算法的算子,实现算法的高效推理,进...
孙广宇李聪
共4页<1234>
聚类工具0