赵宏智

博士 、副教授 、博士生导师

基本信息

办公电话: 电子邮件: hzzhao@bjtu.edu.cn
通讯地址:星空电竞app2026最新版计算机科学与技术学院 邮编:100044

教育背景

1997.09-2001.07 北京科技大学信息工程学院计算机系 获工学学士学位

2001.09-2007.07 北京科技大学信息工程学院计算机系 获工学博士学位

工作经历

2007-至今 星空电竞app2026最新版计算机学院就职讲师、副教授岗位

2015.06-2016.06 美国加州大学尔湾分校访问学者

研究方向与科研荣誉

  • 人工智能软件基础设施开发与加速技术
  • 微处理器体系结构



科研获奖与受邀学术报告:

1.  2025年度 中国人工智能学会-昇腾CANN基金优秀项目奖;获奖理由: 刻画了数据连续性对昇腾处理器上卷积计算性能的影响,给出了最优切片尺寸搜索策略,极大提升了卷积运算的性能;

2.  2022年度 华为鲲鹏众智星光奖 & 金质量奖;获奖理由:极大提升了time函数在鲲鹏处理器上的执行性能,满足了延时敏感网络任务的实时性处理需求;


   2025年6月杭州召开的2025全球人工智能技术大会(GAITC 2025)上,本人作为星空电竞app2026最新版方面的唯一受邀嘉宾,做了主题为“基于CANN的卷积计算优化实践:输入特征图切分策略探索”的专题报告(https://gaitc.caai.cn/)。  课题组的博士生刘恂应华为专家邀请,在2025北京的鲲鹏昇腾开发者大会2025上做关于卷积算子性能优化研究的主题报告。

   2023年4月受华为鲲鹏部门邀请,在北京的鲲鹏开发者大会上做特邀报告。

课题组简介

    课题注于CPU/GPU/NPU处理器上AI模型与算子性能优化(特别是华为昇腾CANN软件生态)这一高壁垒领域进行创新。   解决大厂真问题后再发表论文,而不是从论文到论文。


    近年来硕士博士毕设题目均来源于课题组与工业界大厂合作的项目,所做课题是应聘工作时简历上极具分量的加分项,且有丰厚的课题酬劳。 

    研究生们开发的、严格遵循华为昇腾算子标准的部分成果已经合入华为的开源ops-nn代码仓,可写入简历:

https://gitcode.com/Foriver2/ops-nn/tree/master/experimental/activation/elu_v2
https://gitcode.com/hqnzw/ops-nn_7534/tree/master/experimental/loss/kl_div_loss_grad
https://gitcode.com/m0_66484415/ops-nn/tree/master/experimental/activation/silu_grad
https://gitcode.com/hanchuang101/ops-nn/tree/master/experimental/activation/prelu
https://gitcode.com/hyy_bjtu/ops-nn/tree/master/experimental/activation/elu_grad_v2
https://gitee.com/ascend/cann-ops/pulls?assignee_id=&author_id=&label_ids=&label_text=&milestone_id=&priority=&project_id=ascend%2Fcann-ops&project_type=&scope=&search=%E3%80%90%E5%8C%97%E4%BA%AC%E4%BA%A4%E9%80%9A%E5%A4%A7%E5%AD%A6-%E8%B5%B5%E5%AE%8F%E6%99%BA%E8%80%81%E5%B8%88%E5%9B%A2%E9%98%9F%E3%80%91&single_label_id=&single_label_text=&sort=closed_at+desc&status=merged&target_project=&tester_id=


        学生待遇:基本补贴+课题酬劳(占大头,多劳多得)


       目前团队中的研究生: 2位博士生、10+位硕士生。       团队氛围好,同门之间很团结,友爱互助,项目风险共担,利益共享,项目实施过程中额外的贡献都会计入工作量。

              

      拟27年秋季入学的申请考核的硕士/博士生可以向我申请, hzzhao@bjtu.edu.cn  !!!       硕士生名额剩余3名,博士生名额剩余2名。

科研项目

所主持的科研项目有:

某横向项目:基于昇腾310P边端盒子的算子性能优化攻关项目.2025-2026.

中国人工智能学会-昇腾CANN学术基金项目: 基于CANN的高性能对称加密算法XXX的实现研究. 2025-2026.

华为昇腾众智项目:基于Ascend C的****算子开发.2025.

中国人工智能学会-昇腾CANN学术基金项目:基于CANN平台的****算法研究.2024-2025.

中国计算机学会-某汽车大厂合作项目:***任务性能提升的关键技术研究. 2023-2025.

基本科研业务费研究生创新项目(指导教师): 基于CPU的深度神经网络推断任务加速技术研究. 2023-2025.

人工智能教育部重点实验室项目:深度神经网络推断处理器的访存延时优化与缓冲区管理研究. 2021-2023.

浙江省交通运输研究院开放课题:卷积神经网络推断任务的性能提升关键技术. 2022-2023.

华为鲲鹏合作项目: ***精度库开发. 2023

华为鲲鹏合作项目:***SVE. 2022.

华为鲲鹏合作项目:  AI领域****开发. 2022.

华为鲲鹏合作项目:  glibc库time函数性能优化, 2021.

华为合作协同育人项目(鲲鹏): 基于泰山服务器的汇编语言研究型实验建设. 2019-2020

专利许可项目: 《片上网络限流系数的精确量化方法》专利实施许可项目, 2020-2025

基本科研业务费研究生创新项目(指导教师): DNN训练处理器的片上传输加速策略, 2020-2022

星空电竞app2026最新版: 处理器测试及其配套算法库研发及优化服务, 2019-2020

基本科研业务费: 片上网络的高效容错路由方法研究, 2017-2018

国家自然科学基金"青年基金": 片上网络的高效拥塞感知及协同拥塞控制方法研究, 2015-2017

基本科研业务费: 基于高清晰度拥塞信息的片上网络拥塞控制方法, 2014-2016

基本科研业务费: 片上网络的多层次负载均衡策略研究, 2011-2013

校科技基金: 片上网络技术的基础问题研究, 2007-2009


指导本科生与研究生

研究生毕业去向

23级 国家电网、国家电网、海康威视、奇瑞汽车;

22级 中国商飞上海航空工业集团、中国工商银行天津分行;  19级(博) 参军;

21级 北京银行;

20级 美团、华为、美团、新华三(SP offer);

19级 吉林省公务员、蔚来汽车(SP offer)、航天科工2院;

18级  紫光展锐、中科院自动化所

17级 吉利汽车

15级 中国电科第41所


指导研究生和本科生荣获的华为鲲鹏众智项目证书情况:

1)  Libm数学精度库项目有19位同学;

2)  AVX 2 SVE项目有10位同学;

3)  AI workload项目有4位同学;

4)  Glibc time项目有6位同学;


指导本科生竞赛获奖情况:

1) 2025年 昇腾AI原生创新算子挑战赛S3赛季三等奖
2) 2025年 昇腾AI原生创新算子挑战赛S4赛季获得3个一等奖和2个优秀奖
3) 2025年 昇腾AI原生创新算子挑战赛冠军赛获得银奖;   同时,本人作为指导老师获优秀指导教师奖
4) 2024年 昇腾AI原生创新算子挑战赛S1赛季铜奖(Yang L.; Liu X.; Wu T. )(140多个参赛队伍中,金银铜奖共6个)
5) 2024年 昇腾AI原生创新算子挑战赛S2赛季金奖(Xiao X. P.) (决赛第2名)和最佳性能奖;同时,本人作为指导老师获优秀指导教师奖


申明:没有参与过我指导的大创、竞赛、科研项目、论文等等,也没有加入本研究团队意愿的本科同学,请不要找我要保研推荐信。

专著/译著

 鲁凌云.赵宏智.金一.海峰.《走进奇妙的物联网》.清华大学出版社. 2020年6月.

论文/期刊

  1. Hongzhi Zhao,Liu Xun*, Ruiyang Chen, Chao Tang, Yangyang He, Deyang Wang, Jinxiang Xie. Batched Data Layout-Optimization for im2col-based convolutions on CPUs.  The Journal of SuperComputing(SCICCF C). 2025,81(1219): 1-29.
  2. Wang, Y.; Zhao, H. An Improved Strategy for Data Layout in Convolution Operations on FPGA-Based Multi-Memory Accelerators. Electronics (SCI, JCR - Q2). 2025, 14, 2127:1-12.
  3. Wang Yongchang, Hongzhi Zhao*, Jinyao Zhao. AFHRE: An Accurate and Fast Hardware Resources Estimation Method for Convolutional Accelerator with Systolic Array Structure on FPGA. Electronics.(SCI,  JCR - Q2) . 2025, 14(1)168: 1-21.
  4. Wang Yongchang*, Hongzhi Zhao et al. PKCA: A Priori-Knowledge & Congestion-Awareness Method for Adaptive Routing Algorithms in Mesh Architectures. Transactions on Emerging Telecommunications Technologies,2024.04.(SCI)  https://doi.org/10.1002/ett.4964
  5. Hongzhi Zhao, Xun Liu*, Jingzhen Zheng, Jingjing He. Layered Batch Inference Optimization Method for Convolutional Neural Networks Based on CPU. Proceedings of the 2nd International Seminar on Artificial Intelligence, Networking and Information Technology(ANIT). 2023(1):182-189. 
  6. Jie Wu, Ian G. Harris, Hongzhi Zhao. GraphMemDialog: Optimizing End-to-End Task-Oriented Dialog Systems Using Graph Memory Networks. Proceedings of the 36th AAAI Conference on Artificial Intelligence (AAAI-22, CCF A).  2022, 36(10): 11504-11512.
  7. Jie Wu, Ian G. Harris, Hongzhi Zhao. Spoken Language Understanding for Task-oriented Dialogue Systems with Augmented Memory Networks. Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. (NAACLCCF C) 2021:797-806.
  8. Hongzhi Zhao,Fangzheng Zhang, Linhui Chen and Minghong Lu. A Method of Fast Evaluation of an MC Placement for Network-on-Chip. Journal of Circuits, Systems and Computers(SCI). 2021,30(7): 2150115-1-25.
  9. H. Zhao, N. Bagherzadeh, Q. Wang and Y. Wang, "A Fine-Grained Source-Throttling Method for Mesh Architectures," IEEE Access(SCI),2020,8(1):33101-33112. 
  10. Zhao Hongzhi , Wang Yongchang , Xiong K , et al. An efficient Manhattan-distance-constrained disjoint paths algorithm for incomplete mesh network (SCI). Concurrency and Computation: Practice and Experience (SCI, CCF C类期刊) , 2019,31(1):e4799-1-11.
  11. Zhao Hongzhi, Wang Q, Xiong K, et al. A Path-Counter Method for Fault-Tolerant Minimal Routing Algorithms in 2D Mesh[J]. Journal of Circuits Systems & Computers (SCI), 2018,27(4):1850054-1-22.
  12. Hongzhi Zhao,Nader Bagherzadeh,Jie Wu. A general fault-tolerant minimal routing for mesh architectures. IEEE Transactions on Computers(SCI, CCF A类期刊). 2017, 66(7): 1240-1246.
  13. Hongzhi Zhao,Yuan Xue.  RSD fault block model for highly efficient fault-tolerant Manhattan routing algorithms in 2D mesh. The Computer Journal(SCI, CCF B类期刊), 2016, 59(10): 1511-1526.
  14. Hongzhi Zhao.Source Routing Scheme with load balance ability for Network-on-Chip. Journal of Computational Information Systems, 2012, 8(2): 809-817.
  15. Hongzhi Zhao, Liu.On chip crossbar architecture with load seperation scheme. Journal of Computational Information Systems, 2012, 8(1): 387-396.
  16. 赵宏智.2D Mesh片上网络中交换机服务性能影响的研究及其拓扑改进. 电子学报, 2009,37(2): 294-298. 
  17. 赵宏智.一种适用于片上网络的桥接单元. Proceedings of 2010 CrossStrait Conference on Information Science and Technology, 2010: 76-79.
  18. Hongzhi Zhao. Macro-processing Based SoC SW/HW Co-design Method. Proceedings of 2010 Cross-Strait Conference on Information Science and Technology. 2010: 66-71.
  19. 赵宏智.A kind of 4-high-1-low traffic model for on-chip crossbar. 2009 International Conference on Future Computer and Communication Engineering,2009: 3-6.
  20. 赵宏智,李占才,齐悦,王沁.一种基于ASIP方法的互连IP节点的设计.计算机工程. 2008,34 (2): 258-260.
  21. 荆涛, 王沁, 赵宏智. 一种低速率可重构声码器的研究与设计. 计算机工程. 2008, 34(7):235-237.
  22. Qi Yue, Wang Qin, Zhao Hongzhi, A New Method for Low-power Digital Signal Processing Block Design. The 7th International Symposium on Test and Measurement. Beijing. China. 5~8 August. 2007. 

专利

1, 赵宏智,片上路由器拥塞感知范围的扩大方法,中国,发明专利号:ZL 2013 1 0322950.1;

2, 赵宏智,一种针对路由方向单调变化网络的容错曼哈顿路由方法,中国,发明专利号:ZL 2016 1 0124541.4;

3, 赵宏智,王强, 片上网络限流系数的精确量化方法,中国,发明专利号:ZL 2017 1 0023536.9;(成果已转化)

4, 赵宏智,甄辛, 刘恂.  一种基于视频检测的卷积神经网络推断优化方法,中国,发明专利,授权号:ZL 2022 1 0932532.3;

5, 赵宏智,何景静,刘恂. 一种在多核CPU服务器上的卷积神经网络推断任务调度优化方法,中国,发明专利,申请号:202210801018.6;

6, 赵宏智 , 张芳. 一种深度神经网络推断处理器的访存性能提升方法,中国,发明专利,申请号:202210394533.7

教学工作

  1. 2025年度 星空电竞app2026最新版教学成果奖二等奖““四线并举 合纵连横”的计算机系统能力培养产教融合课程时间体系"(17/17)
  2. 2023年度 计算机学院师德师风先进个人“研途领航”奖
  3. 2023年度 星空电竞app2026最新版 华为奖教金.
  4. 2022年度 华为鲲鹏众智星光奖.
  5. 2021年度/2022年度/2023年度 教育部-华为“智能基座”栋梁之师.
  6. 2022年度 华为“智能基座”产教融合协同育人奖教金
  7. 2021年度 教育部-华为产学合作协同育人项目“基于泰山服务器的汇编语言研究型实验建设”结题优秀.
  8. 2021年度 华为“智能基座”产教融合协同育人奖教金
  9. 2020年度 星空电竞app2026最新版教学成果奖二等奖"新工科背景下计算机科学与技术专业系统设计能力培养的探索与实践"(1/5).  
  10. 2020年度 国家级一流本科课程《算法设计与问题求解》(4/5) .


讲授过的课程:

《汇编与接口技术》(课程负责人)、《VHDL及设计实践》、《算法设计与分析》(硕)、《移动互联网络前沿理论与技术》(博)、《计算机工程前沿》(博)、《Windows CE嵌入式系统》、《大学计算机基础》

社会兼职

中国中医药信息研究会中医药健康大数据分会理事;

中医药与健康信息学专业委员会委员;

中国计算机学会(CCF)高级会员;

教育部学位中心学位论文评审专家;

国家科技专家库的在库专家;

唐山市人民政府特聘专家;


软件加速案例

1,基于昇腾910B处理器的AES算法加速:

  720k明文长度下,

  • AES-128-CTR: 62us; 比项目目标快约6倍
  • AES-128-GCM: 1829us; 比项目目标快约6倍   


2. 华为公司:泰山服务器上glibc time函数性能优化

  • time函数性能单线程提升5倍,多线程提升3倍
  • gettimeofday函数单线程与多线程性能均提升2倍

   被华为公司评选为首批鲲鹏众智优秀开发团队,荣获“鲲鹏众智星光奖”(100多个项目开发团队中只有9个团队获此奖项),研究生Wang Y. C., Zhang F., Zhao J. Y., He J. J., Tang C., Zhou M.等均被华为技术有限公司授予“鲲鹏众智开发者”荣誉称号,其中研究生Zhao J. Y.荣获“鲲鹏众智金质量奖”



Baidu
map