Lü Shuai, 吕帅

在读研究生

2020级博士生（1人）：周瑞凯
2024级博士生（1人）：方文思
2025级博士生（1人）：廉筱峪
2026级博士生（X人）：
2022级硕士生（8人）：朱文博，张鑫宇，张泽宇，林炟君，张少杰，钟太鸿，吴珺泓，安道龙
2023级硕士生（3人）：李松霖，袁健会，肖威
2024级硕士生（9人）：李贵祥，吴昊，孙耕浩，章晓丹，陈黄洋，张涛，檀磊，侯志斌，张顺浩
2025级硕士生（5人）：巩锦程，甄德杰，钟金运，常钰，姜文康
2026级硕士生（X人）：黄会敏

周瑞凯，男，瑶族，1992年07月生，广西壮族自治区桂林市人。

2012.09-2016.06，武汉轻工大学机械工程学院机械设计制造及其自动化专业，本科生
2017.09-2019.06，武汉理工大学汽车工程学院车辆工程专业，硕士生
2020.09至今，吉林大学计算机科学与技术学院计算机软件与理论专业，博士生（导师：吕帅教授）
研究方向：人工智能、机器学习

【学术论文】在国内外期刊和会议上发表学术论文1篇，在审学术论文3篇。

Zhou Ruikai, Li Songlin, Lü Shuai*. From simple to complex: Mitigating the impact of critic accuracy fluctuations by multi-agent reinforcement learning. 2025. (Submitted)
Zhou Ruikai, Zhong Taihong, Li Songlin, Lü Shuai*. A Kullback-Leibler divergence perspective on policy gradient methods in reinforcement learning. 2025. (Submitted)
Zhou Ruikai, Zhong Taihong, Zhu Wenbo, Han Shuai, Lü Shuai*. Influence of Gaussian distribution on performance metrics in continuous reinforcement learning. 2025. (Submitted)
Zhou Ruikai, Zhu Wenbo, Han Shuai, Kang Meng, Lü Shuai*. VCSAP: Online reinforcement learning exploration method based on visitation count of state-action pairs. Neural Networks, 2025, 184: 107052. (中科院2区TOP期刊, CCF推荐B类期刊, SCI, 目前IF: 6.3)

【荣誉奖励】

2020-2021学年，研究生学业奖学金
2021-2022学年，研究生学业奖学金
2022-2023学年，研究生学业奖学金

【联系方式】

邮箱：zhourk20@mails.jlu.edu.cn
办公：吉林大学王湘浩楼B227室
地址：长春市前进大街2699号，130012

方文思，女，1999年01月生，吉林省公主岭市人。

2016.09-2020.06，南昌大学信息工程学院计算机科学与技术专业，本科生
2020.09-2023.06，吉林大学计算机科学与技术学院计算机技术专业，硕士生（导师：李瑛副教授）
2024.09至今，吉林大学计算机科学与技术学院计算机系统结构专业，博士生（导师：李强教授、吕帅教授）
研究方向：人工智能、机器学习

【学术论文】在国内外期刊和会议上发表学术论文3篇，在审学术论文4篇。

Tan Lei, Guo Dong, Fang Wensi, Li Guixiang, Yuan Jianhui, Zhang Xiaodan, Lü Shuai*. Divide and correct: Alternating normalization and prototype alignment for continual test-time adaptation. 2025. (Submitted)
Zhang Xiaodan, Fang Wensi, Tan Lei, Lü Shuai*. AutoVote: Adaptive learning rate modulation for continual test-time adaptation via sensitivity voting. 2025. (Submitted)
Lü Shuai, Yuan Jianhui, Zhang Xinyu, Zhang Shaojie, Fang Wensi, Li Jingyao*. Pre-trained initialization and memory-enhanced correction for source-free universal domain adaptation. 2025. (Submitted)
Li Ying, Fang Wensi, Jiang Xuyang, Sun Hang, Li Linlin, Du Wei*. MGRFE-web: A web server for molecular target identification of Alzheimer’s disease based on feature selection. 2023. (Submitted)
Li Ying, Sun Hang, Fang Wensi, Ma Qin, Han Siyu, Rui Wang-Sattler, Du Wei*, Yu Qiong*. SURE: Screening unlabeled samples for reliable negative samples based on reinforcement learning. Information Sciences, 2023, 629: 299-312. (中科院1区TOP期刊, CCF推荐B类期刊, SCI)
Li Ying, Fang Wensi, Sun Hang, Liu Xiangyu, Du Wei, Liu Yijun, Li Qianqian*. PecidRL: Petition expectation correction and identification based on deep reinforcement learning. Information Processing and Management, 2023, 60(3): 103285. (中科院1区TOP期刊, CCF推荐B类期刊, SCI, IF: 7.4)
Han Siyu, Yang Xiao, Sun Hang, Yang Hu, Zhang Qi, Peng Cheng, Fang Wensi, Li Ying*. LION: An integrated R package for effective prediction of ncRNA–protein interaction. Briefings in Bioinformatics, 2022, 23(6): bbac420. (中科院1区期刊, CCF推荐B类期刊, SCI, IF: 9.5)

【学位论文】

方文思. 基于强化学习的政府留言板标签更正与识别算法研究[硕士学位论文]. 长春: 吉林大学, 2023.

【荣誉奖励】

2016-2017学年，二等奖学金、院优秀学生干部
2017-2018学年，二等奖学金、院三好学生、院优秀学生干部
2018-2019学年，一等奖学金
2024-2025学年，研究生学业奖学金

【联系方式】

邮箱：fangws24@mails.jlu.edu.cn
办公：吉林大学王湘浩楼B227室
地址：长春市前进大街2699号，130012

廉筱峪，男，满族，2001年07月生，辽宁省抚顺市人。

2018.09-2022.06，大连工业大学信息科学与工程学院电子信息工程专业，本科生
2022.09-2025.06，大连工业大学信息科学与工程学院控制科学与工程专业，硕士生（导师：夏楠副教授）
预计2025.09开始，吉林大学计算机科学与技术学院计算机软件与理论专业，博士生（导师：吕帅教授）
研究方向：人工智能、机器学习

【学术论文】在国内外期刊和会议上发表学术论文4篇，在审学术论文0篇。

顾磊, 夏楠*, 江佳鸿, 廉筱峪. 基于时空特征增强的单目标跟踪算法. 浙江大学学报(工学版), 2025.
Lian Xiaoyu, Xia Nan*, Dai Gaole, Yang Hongqin. A dual-branch deep interaction network for multi-channel speech enhancement. Neurocomputing, 2025, 643: 130412. (中科院2区期刊，CCF推荐C类期刊, SCI, 目前IF: 6.5)
Lian Xiaoyu, Xia Nan*, Dai Gaole, Yang Hongqin. An efficient joint training model for monaural noisy-reverberant speech recognition. Applied Acoustics, 2025, 228: 110322. (中科院2区期刊, SCI, 目前IF: 3.6)
廉筱峪, 夏楠*, 戴高乐, 杨红琴. 复杂噪声环境下基于轻量化模型的车内交互语音增强和识别方法. 电子学报, 2024, 52(4): 1282-1287. (CCF推荐中文A类期刊)

【学位论文】

廉筱峪. 基于深度学习的高效去混响噪声语音识别算法研究[硕士学位论文]. 辽宁大连: 大连工业大学, 2025.

【荣誉奖励】

2018-2019学年，三等奖学金
2020-2021学年，二等奖学金
2022-2023学年，研究生一等学业奖学金
2023-2024学年，研究生二等学业奖学金
2024-2025学年，研究生二等学业奖学金、校三好学生
2025.01，辽宁省优秀毕业研究生、大连工业大学优秀毕业研究生

【联系方式】

邮箱：待学校分配
办公：吉林大学王湘浩楼B230室
地址：长春市前进大街2699号，130012

朱文博，女，2000年08月生，吉林省长春市人。

2018.09-2022.06，吉林大学软件学院软件工程专业，本科生
2022.09-2025.06，吉林大学计算机科学与技术学院计算机科学与技术专业，推免硕士生（导师：吕帅教授）
研究方向：人工智能、机器学习
毕业去向：[上海] 华为技术有限公司

【学术论文】在国内外期刊和会议上发表学术论文2篇，在审学术论文6篇。

Zhu Wenbo, Xiao Wei, Lü Shuai*. Soft-penalty guided exploration in reinforcement learning. 2025. (Submitted)
Long Zehong, Zhu Wenbo, Zhang Yushu, Lü Shuai*, Lin Dajun. Efficient exploration via state distribution discrepancy maximization in deep reinforcement learning. 2025. (Submitted)
Zhu Wenbo, Lü Shuai*, Long Zehong, Wu Junhong. Feature distillation for exploration in reinforcement learning. 2023. (Submitted)
Zhou Ruikai, Zhong Taihong, Zhu Wenbo, Han Shuai, Lü Shuai*. Influence of Gaussian distribution on performance metrics in continuous reinforcement learning. 2025. (Submitted)
Long Zehong, Zhu Wenbo, Lü Shuai*, Wu Junhong, Zhong Taihong. Breaking the sample efficiency barrier by rethinking experience replay. 2025. (Submitted)
Zhu Sheng, Wu Hao, Shen Chun, Zhu Wenbo, Han Shuai, Lü Shuai*. Actor-critic of multi-agent collaboration on single-agent task. 2025. (Submitted)
Zhou Ruikai, Zhu Wenbo, Han Shuai, Kang Meng, Lü Shuai*. VCSAP: Online reinforcement learning exploration method based on visitation count of state-action pairs. Neural Networks, 2025, 184: 107052. (中科院2区TOP期刊, CCF推荐B类期刊, SCI, 目前IF: 6.3)
Li Jingyao, Lü Shuai, Zhu Wenbo, Li Zhanshan*. Enhancing transferability and discriminability simultaneously for unsupervised domain adaptation. Knowledge-Based Systems, 2022, 247: 108705. (中科院1区TOP期刊, CCF推荐C类期刊, SCI, IF: 8.8)

【学位论文】

朱文博. 基于特征蒸馏和软惩罚引导的强化学习探索方法研究[硕士学位论文]. 长春: 吉林大学, 2025.

【荣誉奖励】

2018-2019学年，二等奖学金
2019.11，全国大学生数学建模竞赛，省级一等奖
2019-2020学年，二等奖学金
2020.11，全国大学生数学建模竞赛，省级一等奖
2020-2021学年，二等奖学金、院优秀学生
2022.06，吉林大学优秀本科毕业论文：基于策略参数多样性的深度强化学习算法的设计与实现
2022年度，研究生新生奖学金
2022-2023学年，一等奖学金、优秀研究生、研究生学业奖学金
2023-2024学年，研究生学业奖学金

【联系方式】

邮箱：zhuwb22@mails.jlu.edu.cn

张鑫宇，男，1999年04月生，黑龙江省齐齐哈尔市人。

2018.09-2022.06，吉林大学计算机科学与技术学院计算机科学与技术专业，本科生
2022.09-2025.06，吉林大学计算机科学与技术学院计算机科学与技术专业，推免硕士生（导师：吕帅教授）
研究方向：人工智能、机器学习
毕业去向：[北京] 北京字节跳动科技有限公司

【学术论文】在国内外期刊和会议上发表学术论文3篇，在审学术论文2篇。

Yuan Jianhui, Zhang Xinyu, Li Guixiang, Tan Lei, Li Jingyao*, Zhou Wenbo*. GRACE: Enhancing source-free universal domain adaptation via gradient-aware contrastive learning and entropy-aware alignment. 2025. (Submitted).
Lü Shuai, Yuan Jianhui, Zhang Xinyu, Zhang Shaojie, Fang Wensi, Li Jingyao*. Pre-trained initialization and memory-enhanced correction for source-free universal domain adaptation. 2025. (Submitted)
Lü Shuai, Zhang Xinyu, Li Zongze, Li Jingyao*, Kang Meng. Bi-classifier with neighborhood aggregation for unsupervised domain adaptation. Information Sciences, 2025, 718: 122399. (中科院2区期刊, CCF推荐B类期刊, SCI, 目前IF: 6.8)
Zhang Xinyu, Kang Meng, Lü Shuai*. Low category uncertainty and high training potential instance learning for unsupervised domain adaptation. In: Proceedings of the 38th AAAI Conference on Artificial Intelligence (AAAI 2024), Vancouver, Canada, February 20-27, 2024, 16881-16889. (CCF推荐A类会议)
Lü Shuai, Li Zongze, Zhang Xinyu, Li Jingyao*. Consistency regularization-based mutual alignment for source-free domain adaptation. Expert Systems with Applications, 2024, 241: 122577. (中科院1区TOP期刊, CCF推荐C类期刊, SCI, IF: 7.5)

【学位论文】

张鑫宇. 基于自监督学习的无监督领域自适应方法研究[硕士学位论文]. 长春: 吉林大学, 2025.

【荣誉奖励】

2018-2019学年，二等奖学金、院优秀学生
2019-2020学年，二等奖学金、院优秀学生
2020-2021学年，二等奖学金、院优秀学生
2021-2022学年，三等奖学金
2022.06，吉林大学优秀本科毕业论文：基于双分类器确定性最大化的无监督领域自适应算法的设计和实现
2022年度，研究生新生奖学金
2022-2023学年，研究生学业奖学金
2023年度，南瑞继保奖学金
2023-2024学年，一等奖学金、优秀研究生、研究生学业奖学金
2024年度，研究生国家奖学金
2024年度，比亚迪奖学金
2024-2025学年，研究生学业奖学金
2025.06，吉林大学优秀硕士学位论文：基于自监督学习的无监督领域自适应方法研究
2025.06，吉林大学优秀毕业研究生

【联系方式】

邮箱：zhang_xinyu22@mails.jlu.edu.cn

张泽宇，男，2000年09月生，山东省滨州市人。

2018.09-2022.06，内蒙古大学计算机学院（软件学院）计算机科学与技术专业，本科生（学业排名和综合排名均为第1/38名）
2022.09-2025.06，吉林大学计算机科学与技术学院计算机科学与技术专业，推免硕士生（导师：吕帅教授、申春副教授）
研究方向：人工智能、机器学习
毕业去向：[山东滨州] 滨州魏桥国科高等技术研究院

【学术论文】在国内外期刊和会议上发表学术论文2篇，在审学术论文1篇。

Zhang Zeyu, Shen Chun, Ma Qiang, Kang Meng, Lü Shuai*. Prototype-driven active domain adaptation with density consideration. 2025. (Submitted)
Zhang Zeyu, Shen Chun, Lü Shuai*, Zhang Shaojie. Reconfigurability-aware selection for contrastive active domain adaptation. In: Proceedings of the 33rd International Joint Conference on Artificial Intelligence (IJCAI 2024), Jeju, South Korea, August 3-9, 2024, 5545-5553. (CCF推荐A类会议)
Zhang Shaojie, Shen Chun, Lü Shuai*, Zhang Zeyu. Reviewing the forgotten classes for domain adaptation of black-box predictors. In: Proceedings of the 38th AAAI Conference on Artificial Intelligence (AAAI 2024), Vancouver, Canada, February 20-27, 2024, 16830-16837. (CCF推荐A类会议)

【学位论文】

张泽宇. 基于主动学习的领域自适应方法研究[硕士学位论文]. 长春: 吉林大学, 2025.

【荣誉奖励】

2019.04，中国高校计算机大赛团体程序设计天梯赛，团队省级特等奖
2019-2020学年，一等奖学金、校三好学生
2020.10，东北地区大学生程序设计竞赛，优胜奖
2020.12，中国高校计算机大赛团体程序设计天梯赛，团队省级一等奖
2020-2021学年，国家奖学金
2022.06，内蒙古大学优秀本科毕业论文：面向OBE模式的工程教育认证自评与辅助管理系统
2022.12，中国研究生数学建模竞赛，国家级一等奖
2022-2023学年，一等奖学金、优秀研究生、研究生学业奖学金
2023年度，浪潮奖学金
2023-2024学年，一等奖学金、优秀研究生、研究生学业奖学金
2024年度，研究生国家奖学金
2024年度，吉林银行王湘浩奖学金
2024-2025学年，研究生学业奖学金
2025.06，吉林大学优秀硕士学位论文：基于主动学习的领域自适应方法研究
2025.06，吉林大学优秀毕业研究生

【联系方式】

邮箱：zeyuz22@mails.jlu.edu.cn

林炟君，女，2000年08月生，福建省莆田市人。

2018.09-2022.06，海南大学计算机科学与技术学院软件工程专业，本科生
2022.09-2025.06，吉林大学软件学院软件工程专业，推免硕士生（导师：吕帅教授、刘磊教授）
研究方向：人工智能、机器学习
毕业去向：[广东深圳] 比亚迪股份有限公司

【学术论文和发明专利】在国内外期刊和会议上发表学术论文0篇，在审学术论文2篇，授权发明专利1项。

Lin Dajun, Li Songlin, Lü Shuai*, Zhou Wenbo*, Zhong Taihong, An Daolong. WCPC-TD3: Weighted contrastive policy constraint for offline reinforcement learning. 2025. (Submitted)
Long Zehong, Zhu Wenbo, Zhang Yushu, Lü Shuai*, Lin Dajun. Efficient exploration via state distribution discrepancy maximization in deep reinforcement learning. 2025. (Submitted)
吕帅, 龙泽泓, 钟太鸿, 林炟君. 一种基于SAC强化学习算法的智能运动控制方法. (专利号: ZL 2024 1 0726196.6, 授权公告日: 2024.08.13)

【学位论文】

林炟君. 基于策略约束和反探索的离线强化学习方法研究[硕士学位论文]. 长春: 吉林大学, 2025.

【荣誉奖励】

2018-2019学年，三等奖学金、院优秀学生会干部
2019-2020学年，二等奖学金
2020.11，全国大学生数学建模竞赛，国家级二等奖、省级一等奖
2020-2021学年，三等奖学金
2022-2023学年，研究生学业奖学金
2023-2024学年，研究生学业奖学金
2024-2025学年，研究生学业奖学金

【联系方式】

邮箱：lindj22@mails.jlu.edu.cn

张少杰，男，2000年04月生，安徽省合肥市人。

2018.09-2022.06，哈尔滨工程大学软件学院软件工程专业，本科生
2022.09-2025.06，吉林大学软件学院软件工程专业，推免硕士生（导师：吕帅教授、申春副教授）
研究方向：人工智能、机器学习
毕业去向：[上海] 华为技术有限公司

【学术论文】在国内外期刊和会议上发表学术论文2篇，在审学术论文1篇。

Lü Shuai, Yuan Jianhui, Zhang Xinyu, Zhang Shaojie, Fang Wensi, Li Jingyao*. Pre-trained initialization and memory-enhanced correction for source-free universal domain adaptation. 2025. (Submitted)
Zhang Zeyu, Shen Chun, Lü Shuai*, Zhang Shaojie. Reconfigurability-aware selection for contrastive active domain adaptation. In: Proceedings of the 33rd International Joint Conference on Artificial Intelligence (IJCAI 2024), Jeju, South Korea, August 3-9, 2024, 5545-5553. (CCF推荐A类会议)
Zhang Shaojie, Shen Chun, Lü Shuai*, Zhang Zeyu. Reviewing the forgotten classes for domain adaptation of black-box predictors. In: Proceedings of the 38th AAAI Conference on Artificial Intelligence (AAAI 2024), Vancouver, Canada, February 20-27, 2024, 16830-16837. (CCF推荐A类会议)

【学位论文】

张少杰. 基于黑盒模型的无源领域自适应方法研究[硕士学位论文]. 长春: 吉林大学, 2025.

【荣誉奖励】

2018-2019学年，三等奖学金、二等奖学金
2019-2020学年，二等奖学金、二等奖学金
2020-2021学年，二等奖学金、二等奖学金、院三好学生
2021-2022学年，二等奖学金、一等奖学金
2022.12，中国研究生数学建模竞赛，国家级一等奖
2022-2023学年，二等奖学金、优秀研究生
2023-2024学年，一等奖学金、优秀研究生、研究生学业奖学金
2024年度，研究生国家奖学金
2024年度，吉林银行王湘浩奖学金
2024-2025学年，研究生学业奖学金
2025.06，吉林大学优秀硕士学位论文：基于黑盒模型的无源领域自适应方法研究
2025.06，吉林大学优秀毕业研究生

【联系方式】

邮箱：sjzhang22@mails.jlu.edu.cn

钟太鸿，男，1999年11月生，辽宁省大连市人。

2018.09-2022.06，沈阳工业大学软件学院软件工程专业，本科生（学业排名和综合排名均为第1/296名）
2022.09-2025.06，吉林大学软件学院软件工程专业，推免硕士生（导师：吕帅教授）
研究方向：人工智能、机器学习
毕业去向：[北京] 国家电网有限公司

【学术论文和发明专利】在国内外期刊和会议上发表学术论文0篇，在审学术论文6篇，授权发明专利1项。

Wu Hao, Li Songlin, Xiao Wei, Zhong Taihong, Lü Shuai*. Offline-to-online reinforcement learning with triple-intensity policy constraints. 2025. (Submitted)
Lin Dajun, Li Songlin, Lü Shuai*, Zhou Wenbo*, Zhong Taihong, An Daolong. WCPC-TD3: Weighted contrastive policy constraint for offline reinforcement learning. 2025. (Submitted)
Zhou Ruikai, Zhong Taihong, Li Songlin, Lü Shuai*. A Kullback-Leibler divergence perspective on policy gradient methods in reinforcement learning. 2025. (Submitted)
Zhou Ruikai, Zhong Taihong, Zhu Wenbo, Han Shuai, Lü Shuai*. Influence of Gaussian distribution on performance metrics in continuous reinforcement learning. 2025. (Submitted)
Zhong Taihong, Han Shuai, Zhang Yushu, Long Zehong, Lü Shuai*, Wu Junhong. TATRC: Triple actor-critic structure with regularization for better performance. 2025. (Submitted)
Long Zehong, Zhu Wenbo, Lü Shuai*, Wu Junhong, Zhong Taihong. Breaking the sample efficiency barrier by rethinking experience replay. 2025. (Submitted)
吕帅, 龙泽泓, 钟太鸿, 林炟君. 一种基于SAC强化学习算法的智能运动控制方法. (专利号: ZL 2024 1 0726196.6, 授权公告日: 2024.08.13)

【学位论文】

钟太鸿. 基于分布偏移的深度强化学习方法研究[硕士学位论文]. 长春: 吉林大学, 2025.

【荣誉奖励】

2018-2019学年，辽宁省政府奖学金、一等奖学金、三好学生标兵
2019-2020学年，国家奖学金、特等奖学金、校三好学生
2020.11，软件设计师（软考中级）
2020-2021学年，国家奖学金、特等奖学金、校三好学生
2020-2021学年，“一带一路”耿飚奖学金
2022.06，沈阳工业大学优秀毕业生
2023-2024学年，研究生学业奖学金
2024-2025学年，研究生学业奖学金

【联系方式】

邮箱：zhongth22@mails.jlu.edu.cn

吴珺泓，男，2000年09月生，山东省莱西市人。

2018.09-2022.06，成都理工大学计算机与网络安全学院（牛津布鲁克斯学院）软件工程专业，本科生
2022.09-2025.06，吉林大学软件学院软件工程专业，推免硕士生（导师：吕帅教授、刘杰副教授）
研究方向：人工智能、机器学习
毕业去向：[北京] 北京京东世纪贸易有限公司

【学术论文】在国内外期刊和会议上发表学术论文2篇，在审学术论文4篇。

Wu Junhong, Liu Jie, Xiong Xi, An Daolong, Lü Shuai*. Focus on primary: Differential diverse data augmentation for generalization in visual reinforcement learning. 2025. (Submitted)
Zhu Wenbo, Lü Shuai*, Long Zehong, Wu Junhong. Feature distillation for exploration in reinforcement learning. 2023. (Submitted)
Zhong Taihong, Han Shuai, Zhang Yushu, Long Zehong, Lü Shuai*, Wu Junhong. TATRC: Triple actor-critic structure with regularization for better performance. 2025. (Submitted)
Long Zehong, Zhu Wenbo, Lü Shuai*, Wu Junhong, Zhong Taihong. Breaking the sample efficiency barrier by rethinking experience replay. 2025. (Submitted)
Xiong Xi, Shen Chun, Wu Junhong, Lü Shuai*, Zhang Xiaodan. Combined data augmentation framework for generalizing deep reinforcement learning from pixels. Expert Systems with Applications, 2025, 264: 125810. (中科院1区TOP期刊, CCF推荐C类期刊, SCI, 目前IF: 7.5)
Zhu Sheng, Shen Chun, Lü Shuai*, Wu Junhong, An Daolong. Double buffers CEM-TD3: More efficient evolution and richer exploration. In: Proceedings of the 38th AAAI Conference on Artificial Intelligence (AAAI 2024), Vancouver, Canada, February 20-27, 2024, 17193-17201. (CCF推荐A类会议)

【学位论文】

吴珺泓. 基于数据增强的可泛化视觉强化学习研究[硕士学位论文]. 长春: 吉林大学, 2025.

【荣誉奖励】

2018-2019学年，一等奖学金、校优秀学生
2019-2020学年，一等奖学金、校优秀学生
2020.11，全国大学生数学建模竞赛，省级一等奖
2020-2021学年，国家奖学金、一等奖学金、校优秀学生
2021.12，成都理工大学十佳大学生
2022.03，四川省优秀大学毕业生
2022.06，成都理工大学优秀毕业生
2022.12，中国研究生数学建模竞赛，国家级一等奖
2022年度，研究生学术业绩三等奖学金
2022-2023学年，研究生学业奖学金
2023-2024学年，一等奖学金、优秀研究生
2024年度，研究生国家奖学金
2024年度，吉林银行王湘浩奖学金
2024-2025学年，研究生学业奖学金
2025.06，吉林大学优秀毕业研究生

【联系方式】

邮箱：chwu22@mails.jlu.edu.cn

安道龙，男，1998年10月生，河南省濮阳市人。

2017.09-2021.06，吉林大学计算机科学与技术学院物联网工程专业，本科生
2022.09-2025.06，吉林大学计算机科学与技术学院计算机技术专业，硕士生（导师：吕帅教授、申春副教授）
研究方向：人工智能、机器学习
毕业去向：[上海] 华为技术有限公司

【学术论文】在国内外期刊和会议上发表学术论文2篇，在审学术论文5篇。

Xiao Wei, Li Songlin, An Daolong, Wu Hao, Zhang Xiaodan, Lü Shuai*. Corrected critic and adaptive constraint for offline-to-online reinforcement learning. 2025. (Submitted)
Li Songlin, Xiao Wei, Wu Hao, Zhang Xiaodan, An Daolong, Lü Shuai*. State proficiency-based adaptive fine-tuning for offline-to-online reinforcement learning. 2025. (Submitted)
An Daolong, Shen Chun, Li Songlin, Xiao Wei, Lü Shuai*, Zhou Wenbo*. Result constraint behavior clone for offline reinforcement learning. 2025. (Submitted)
Lin Dajun, Li Songlin, Lü Shuai*, Zhou Wenbo*, Zhong Taihong, An Daolong. WCPC-TD3: Weighted contrastive policy constraint for offline reinforcement learning. 2025. (Submitted)
Wu Junhong, Liu Jie, Xiong Xi, An Daolong, Lü Shuai*. Focus on primary: Differential diverse data augmentation for generalization in visual reinforcement learning. 2025. (Submitted)
Shu Man, Lü Shuai*, Gong Xiaoyu, An Daolong, Li Songlin. Episodic memory-double actor-critic twin delayed deep deterministic policy gradient. Neural Networks, 2025, 187: 107286. (中科院2区TOP期刊, CCF推荐B类期刊, SCI, 目前IF: 6.3)
Zhu Sheng, Shen Chun, Lü Shuai*, Wu Junhong, An Daolong. Double buffers CEM-TD3: More efficient evolution and richer exploration. In: Proceedings of the 38th AAAI Conference on Artificial Intelligence (AAAI 2024), Vancouver, Canada, February 20-27, 2024, 17193-17201. (CCF推荐A类会议)

【学位论文】

安道龙. 基于结果约束和梯度权重的离线强化学习方法研究[硕士学位论文]. 长春: 吉林大学, 2025.

【荣誉奖励】

2019.07，全国大学生水利创新设计大赛，国家级二等奖
2019-2020学年，国家励志奖学金
2020.08，全国大学生物联网设计竞赛（华为杯），东北赛区一等奖
2020-2021学年，二等奖学金
2022-2023学年，二等奖学金
2023-2024学年，研究生学业奖学金
2024-2025学年，研究生学业奖学金

【联系方式】

邮箱：andl22@mails.jlu.edu.cn

李松霖，男，2000年12月生，吉林省长春市人。

2019.09-2023.06，吉林大学计算机科学与技术学院计算机科学与技术专业，本科生
2023.09至今，吉林大学计算机科学与技术学院计算机科学与技术专业，推免硕士生（导师：吕帅教授）
研究方向：人工智能、机器学习

【学术论文】在国内外期刊和会议上发表学术论文1篇，在审学术论文8篇。

Li Songlin, Wu Hao, Chen Huangyang, Zhou Wenbo*, Li Jingyao*. Anchor-based perturbation-driven exploration for offline-to-online reinforcement learning. 2025. (Submitted)
Xiao Wei, Li Songlin, An Daolong, Wu Hao, Zhang Xiaodan, Lü Shuai*. Corrected critic and adaptive constraint for offline-to-online reinforcement learning. 2025. (Submitted)
Li Songlin, Xiao Wei, Wu Hao, Zhang Xiaodan, An Daolong, Lü Shuai*. State proficiency-based adaptive fine-tuning for offline-to-online reinforcement learning. 2025. (Submitted)
Wu Hao, Li Songlin, Xiao Wei, Zhong Taihong, Lü Shuai*. Offline-to-online reinforcement learning with triple-intensity policy constraints. 2025. (Submitted)
An Daolong, Shen Chun, Li Songlin, Xiao Wei, Lü Shuai*, Zhou Wenbo*. Result constraint behavior clone for offline reinforcement learning. 2025. (Submitted)
Lin Dajun, Li Songlin, Lü Shuai*, Zhou Wenbo*, Zhong Taihong, An Daolong. WCPC-TD3: Weighted contrastive policy constraint for offline reinforcement learning. 2025. (Submitted)
Zhou Ruikai, Li Songlin, Lü Shuai*. From simple to complex: Mitigating the impact of critic accuracy fluctuations by multi-agent reinforcement learning. 2025. (Submitted)
Zhou Ruikai, Zhong Taihong, Li Songlin, Lü Shuai*. A Kullback-Leibler divergence perspective on policy gradient methods in reinforcement learning. 2025. (Submitted)
Shu Man, Lü Shuai*, Gong Xiaoyu, An Daolong, Li Songlin. Episodic memory-double actor-critic twin delayed deep deterministic policy gradient. Neural Networks, 2025, 187: 107286. (中科院2区TOP期刊, CCF推荐B类期刊, SCI, 目前IF: 6.3)

【荣誉奖励】

2019-2020学年，一等奖学金、院优秀学生
2020-2021学年，一等奖学金、校优秀学生
2021-2022学年，一等奖学金、院优秀学生
2022-2023学年，二等奖学金、院优秀学生
2023.06，吉林大学优秀本科毕业论文：基于集成策略和集成评估提高强化学习样本效率和泛化能力
2023-2024学年，二等奖学金、优秀研究生、研究生学业奖学金
2024.12，中国研究生数学建模竞赛，国家级三等奖
2024-2025学年，研究生学业奖学金

【联系方式】

邮箱：lisl23@mails.jlu.edu.cn
办公：吉林大学王湘浩楼B227室
地址：长春市前进大街2699号，130012

袁健会，男，1999年06月生，吉林省长春市人。

2018.09-2022.06，东北电力大学计算机学院计算机科学与技术（卓越）专业，本科生（导师：李壮副教授）
2023.09至今，吉林大学软件学院软件工程专业，硕士生（导师：吕帅教授）
研究方向：人工智能、机器学习

【学术论文】在国内外期刊和会议上发表学术论文1篇，在审学术论文3篇。

Tan Lei, Guo Dong, Fang Wensi, Li Guixiang, Yuan Jianhui, Zhang Xiaodan, Lü Shuai*. Divide and correct: Alternating normalization and prototype alignment for continual test-time adaptation. 2025. (Submitted)
Yuan Jianhui, Zhang Xinyu, Li Guixiang, Tan Lei, Li Jingyao*, Zhou Wenbo*. GRACE: Enhancing source-free universal domain adaptation via gradient-aware contrastive learning and entropy-aware alignment. 2025. (Submitted).
Lü Shuai, Yuan Jianhui, Zhang Xinyu, Zhang Shaojie, Fang Wensi, Li Jingyao*. Pre-trained initialization and memory-enhanced correction for source-free universal domain adaptation. 2025. (Submitted).
Li Zhuang, Yuan Jianhui, Li Guixiang, Wang Hao, Li Xingcan, Li Dan, Wang Xinhua*. RSI-YOLO: Object detection method for remote sensing images based on improved YOLO. Sensors, 2023, 23: 6414. (中科院2区期刊, SCI, IF: 3.4)

【荣誉奖励】

2018-2019学年，国家励志奖学金、三等奖学金
2019-2020学年，国家励志奖学金、吉林省政府奖学金、二等奖学金、二等奖学金、校优秀学生干部标兵
2019-2020学年，芮捷助学金
2020.12，吉林省大学生电子设计竞赛，省级一等奖
2020-2021学年，三等奖学金、校优秀学生干部
2023-2024学年，优秀研究生、研究生学业奖学金
2024.12，中国研究生数学建模竞赛，国家级三等奖
2024-2025学年，研究生学业奖学金

【联系方式】

邮箱：jhyuan23@mails.jlu.edu.cn
办公：吉林大学王湘浩楼B227室
地址：长春市前进大街2699号，130012

肖威，男，2001年11月生，山东省菏泽市人。

2019.09-2023.06，山东师范大学信息科学与工程学院计算机科学与技术专业，本科生
2023.09至今，吉林大学计算机科学与技术学院计算机科学与技术专业，硕士生（导师：吕帅教授）
研究方向：人工智能、机器学习

【学术论文】在国内外期刊和会议上发表学术论文0篇，在审学术论文6篇。

Xiao Wei, Zhang Tao, Chen Huangyang, Li Jingyao*, Zhou Wenbo*. Q-bounded and adaptive Q-value constraints for offline-to-online reinforcement learning. 2025. (Submitted)
Xiao Wei, Li Songlin, An Daolong, Wu Hao, Zhang Xiaodan, Lü Shuai*. Corrected critic and adaptive constraint for offline-to-online reinforcement learning. 2025. (Submitted)
Li Songlin, Xiao Wei, Wu Hao, Zhang Xiaodan, An Daolong, Lü Shuai*. State proficiency-based adaptive fine-tuning for offline-to-online reinforcement learning. 2025. (Submitted)
Wu Hao, Li Songlin, Xiao Wei, Zhong Taihong, Lü Shuai*. Offline-to-online reinforcement learning with triple-intensity policy constraints. 2025. (Submitted)
An Daolong, Shen Chun, Li Songlin, Xiao Wei, Lü Shuai*, Zhou Wenbo*. Result constraint behavior clone for offline reinforcement learning. 2025. (Submitted)
Zhu Wenbo, Xiao Wei, Lü Shuai*. Soft-penalty guided exploration in reinforcement learning. 2025. (Submitted)

【荣誉奖励】

2019-2020学年，三等奖学金、校优秀学生、校优秀学生干部
2020-2021学年，二等奖学金
2020-2021学年，三兴未来助学金
2021.05，蓝桥杯全国软件和信息技术专业人才大赛，省级一等奖
2023-2024学年，优秀研究生
2024.12，中国研究生数学建模竞赛，国家级三等奖
2024-2025学年，研究生学业奖学金

【联系方式】

邮箱：weixiao23@mails.jlu.edu.cn
办公：吉林大学王湘浩楼B227室
地址：长春市前进大街2699号，130012

李贵祥，男，2003年04月生，山东省聊城市人。

2020.09-2024.06，东北电力大学计算机学院智能科学与技术专业，本科生（导师：李壮副教授）（学业排名和综合排名均为第1/76名）
2024.09至今，吉林大学软件学院软件工程专业，推免硕士生（导师：吕帅教授）
研究方向：人工智能、机器学习

【学术论文】在国内外期刊和会议上发表学术论文2篇，在审学术论文2篇。

Tan Lei, Guo Dong, Fang Wensi, Li Guixiang, Yuan Jianhui, Zhang Xiaodan, Lü Shuai*. Divide and correct: Alternating normalization and prototype alignment for continual test-time adaptation. 2025. (Submitted)
Yuan Jianhui, Zhang Xinyu, Li Guixiang, Tan Lei, Li Jingyao*, Zhou Wenbo*. GRACE: Enhancing source-free universal domain adaptation via gradient-aware contrastive learning and entropy-aware alignment. 2025. (Submitted).
Li Zhuang, Li Guixiang, Song Xiangyang, Wang Xinhua*. EVD-YOLO: An efficient and dynamic framework for multi-scale target detection of underwater organisms. Journal of Ocean University of China, 2025. (中科院2区期刊, SCI, 目前IF: 1.2)
Li Zhuang, Yuan Jianhui, Li Guixiang, Wang Hao, Li Xingcan, Li Dan, Wang Xinhua*. RSI-YOLO: Object detection method for remote sensing images based on improved YOLO. Sensors, 2023, 23: 6414. (中科院2区期刊, SCI, IF: 3.4)

【荣誉奖励】

2020-2021学年，一等奖学金、校优秀学生
2021-2022学年，一等奖学金、二等奖学金、校优秀学生标兵
2022-2023学年，二等奖学金
2023.04，蓝桥杯全国软件和信息技术专业人才大赛，省级一等奖
2023.05，美国大学生数学建模竞赛，国家级三等奖
2024.12，中国研究生数学建模竞赛，国家级三等奖
2024-2025学年，研究生学业奖学金

【联系方式】

邮箱：guixiang24@mails.jlu.edu.cn
办公：吉林大学王湘浩楼B227室
地址：长春市前进大街2699号，130012

吴昊，男，2002年02月生，内蒙古自治区额尔古纳市人。

2020.09-2024.06，吉林大学计算机科学与技术学院计算机科学与技术专业，本科生
2024.09至今，吉林大学计算机科学与技术学院计算机科学与技术专业，推免硕士生（导师：吕帅教授）
研究方向：人工智能、机器学习

【学术论文】在国内外期刊和会议上发表学术论文0篇，在审学术论文6篇。

Wu Hao, Zhang Shunhao, Chen Huangyang, Zhang Tao, Zhou Wenbo*, Li Jingyao*. UDPBC: Uncertainty-guided dual-perspective behavior cloning for offline-to-online reinforcement learning. 2025. (Submitted)
Li Songlin, Wu Hao, Chen Huangyang, Zhou Wenbo*, Li Jingyao*. Anchor-based perturbation-driven exploration for offline-to-online reinforcement learning. 2025. (Submitted)
Xiao Wei, Li Songlin, An Daolong, Wu Hao, Zhang Xiaodan, Lü Shuai*. Corrected critic and adaptive constraint for offline-to-online reinforcement learning. 2025. (Submitted)
Li Songlin, Xiao Wei, Wu Hao, Zhang Xiaodan, An Daolong, Lü Shuai*. State proficiency-based adaptive fine-tuning for offline-to-online reinforcement learning. 2025. (Submitted)
Wu Hao, Li Songlin, Xiao Wei, Zhong Taihong, Lü Shuai*. Offline-to-online reinforcement learning with triple-intensity policy constraints. 2025. (Submitted)
Zhu Sheng, Wu Hao, Shen Chun, Zhu Wenbo, Han Shuai, Lü Shuai*. Actor-critic of multi-agent collaboration on single-agent task. 2025. (Submitted)

【荣誉奖励】

2020-2021学年，三等奖学金
2021-2022学年，二等奖学金、院优秀学生
2022-2023学年，二等奖学金、院优秀学生
2023.04，蓝桥杯全国软件和信息技术专业人才大赛，省级一等奖
2023.06，蓝桥杯全国软件和信息技术专业人才大赛全国总决赛，国家级优秀奖
2023.08，中国大学生计算机博弈大赛海克斯项目，国家级一等奖（冠军）
2023年度，吉林大学智能基座产教融合协同育人基地奖学金
2024-2025学年，研究生学业奖学金

【联系方式】

邮箱：haowu24@mails.jlu.edu.cn
办公：吉林大学王湘浩楼B230室
地址：长春市前进大街2699号，130012

孙耕浩，男，2001年07月生，山东省德州市人。

2020.09-2024.06，西安石油大学计算机学院计算机科学与技术专业，本科生（学业排名为第2/181名，综合排名为第1/181名）
2024.09至今，吉林大学软件学院软件工程专业，推免硕士生（导师：吕帅教授）
研究方向：人工智能、机器学习

【学术论文】在国内外期刊和会议上发表学术论文0篇，在审学术论文1篇。

Chen Huangyang, Chen Juan, Zhang Tao, Sun Genghao, Lü Shuai*. Reward shaping based on trajectory quality for offline and hybrid reinforcement learning. 2025. (Submitted)

【荣誉奖励】

2020-2021学年，国家励志奖学金、校三好学生、校优秀学生干部
2021-2022学年，国家奖学金、校三好学生、校优秀学生干部
2022.11，中国机器人大赛暨RoboCup机器人世界杯中国赛FIRA小型组半自主5vs5项目，国家级二等奖
2022.11，中国机器人大赛暨RoboCup机器人世界杯中国赛FIRA小型组半自主11vs11项目，国家级二等奖
2022-2023学年，国家励志奖学金
2023.11，中国机器人大赛暨RoboCup机器人世界杯中国赛FIRA小型组半自主5vs5项目，国家级一等奖（亚军）
2024.12，中国研究生数学建模竞赛，国家级三等奖
2024-2025学年，研究生学业奖学金

【联系方式】

邮箱：sungh24@mails.jlu.edu.cn
办公：吉林大学王湘浩楼B227室
地址：长春市前进大街2699号，130012

章晓丹，女，2002年01月生，山东省威海市人。

2020.09-2024.06，吉林大学计算机科学与技术学院计算机科学与技术专业，本科生
2024.09至今，吉林大学计算机科学与技术学院计算机科学与技术专业，推免硕士生（导师：吕帅教授）
研究方向：人工智能、机器学习

【学术论文】在国内外期刊和会议上发表学术论文1篇，在审学术论文4篇。

Tan Lei, Guo Dong, Fang Wensi, Li Guixiang, Yuan Jianhui, Zhang Xiaodan, Lü Shuai*. Divide and correct: Alternating normalization and prototype alignment for continual test-time adaptation. 2025. (Submitted)
Zhang Xiaodan, Fang Wensi, Tan Lei, Lü Shuai*. AutoVote: Adaptive learning rate modulation for continual test-time adaptation via sensitivity voting. 2025. (Submitted)
Xiao Wei, Li Songlin, An Daolong, Wu Hao, Zhang Xiaodan, Lü Shuai*. Corrected critic and adaptive constraint for offline-to-online reinforcement learning. 2025. (Submitted)
Li Songlin, Xiao Wei, Wu Hao, Zhang Xiaodan, An Daolong, Lü Shuai*. State proficiency-based adaptive fine-tuning for offline-to-online reinforcement learning. 2025. (Submitted)
Xiong Xi, Shen Chun, Wu Junhong, Lü Shuai*, Zhang Xiaodan. Combined data augmentation framework for generalizing deep reinforcement learning from pixels. Expert Systems with Applications, 2025, 264: 125810. (中科院1区TOP期刊, CCF推荐C类期刊, SCI, 目前IF: 7.5)

【荣誉奖励】

2020-2021学年，一等奖学金、校优秀学生
2021.11，全国大学生数学建模竞赛，国家级二等奖
2021.12，全国大学生数学建模竞赛，省级一等奖
2021-2022学年，二等奖学金、院优秀学生
2022.12，全国大学生数学建模竞赛，省级一等奖
2022-2023学年，三等奖学金
2023.04，全国大学生市场调研与分析大赛，国家级三等奖
2023.05，美国大学生数学建模竞赛，国家级三等奖
2023.06，大学生创新创业训练计划——创新训练项目：基于Vtuber的对韩成语文化输出模式的探讨与实践，国家级优秀结题（项目成员）
2024.06，吉林大学优秀本科毕业生
2024.12，中国研究生数学建模竞赛，国家级三等奖
2024-2025学年，研究生学业奖学金

【联系方式】

邮箱：xdzhang24@mails.jlu.edu.cn
办公：吉林大学王湘浩楼B227室
地址：长春市前进大街2699号，130012

陈黄洋，男，2002年08月生，福建省漳州市人。

2020.09-2024.06，东北电力大学计算机学院软件工程专业，本科生（学业排名和综合排名均为第1/70名）
2024.09至今，吉林大学软件学院软件工程专业，推免硕士生（导师：吕帅教授、陈娟教授）
研究方向：人工智能、机器学习

【学术论文】在国内外期刊和会议上发表学术论文0篇，在审学术论文4篇。

Wu Hao, Zhang Shunhao, Chen Huangyang, Zhang Tao, Zhou Wenbo*, Li Jingyao*. UDPBC: Uncertainty-guided dual-perspective behavior cloning for offline-to-online reinforcement learning. 2025. (Submitted)
Xiao Wei, Zhang Tao, Chen Huangyang, Li Jingyao*, Zhou Wenbo*. Q-bounded and adaptive Q-value constraints for offline-to-online reinforcement learning. 2025. (Submitted)
Li Songlin, Wu Hao, Chen Huangyang, Zhou Wenbo*, Li Jingyao*. Anchor-based perturbation-driven exploration for offline-to-online reinforcement learning. 2025. (Submitted)
Chen Huangyang, Chen Juan, Zhang Tao, Sun Genghao, Lü Shuai*. Reward shaping based on trajectory quality for offline and hybrid reinforcement learning. 2025. (Submitted)

【荣誉奖励】

2020-2021学年，一等奖学金、校优秀学生标兵
2021-2022学年，一等奖学金、校优秀学生标兵、校优秀学生干部
2022.12，全国大学生数学建模竞赛，省级一等奖
2022-2023学年，国家奖学金、一等奖学金
2023.04，蓝桥杯全国软件和信息技术专业人才大赛，省级一等奖
2023.05，中国高校计算机设计大赛团体程序设计天梯赛，团队国家二等奖、个人国家三等奖
2023.06，蓝桥杯全国软件和信息技术专业人才大赛全国总决赛，国家级一等奖
2024.04，蓝桥杯全国软件和信息技术专业人才大赛，省级一等奖
2024.04，中国高校计算机设计大赛团体程序设计天梯赛，团队国家三等奖、个人国家二等奖
2024.06，蓝桥杯全国软件和信息技术专业人才大赛全国总决赛，国家级一等奖
2024.12，中国研究生数学建模竞赛，国家级三等奖
2024-2025学年，研究生学业奖学金

【联系方式】

邮箱：hychen24@mails.jlu.edu.cn
办公：吉林大学王湘浩楼B227室
地址：长春市前进大街2699号，130012

张涛，男，2002年10月生，河南省濮阳市人。

2020.09-2024.06，辽宁科技大学计算机与软件工程学院网络工程专业，本科生（学业排名和综合排名均为第1/144名）
2024.09至今，吉林大学软件学院软件工程专业，推免硕士生（导师：吕帅教授、朱允刚副教授）
研究方向：人工智能、机器学习

【学术论文】在国内外期刊和会议上发表学术论文0篇，在审学术论文3篇。

Wu Hao, Zhang Shunhao, Chen Huangyang, Zhang Tao, Zhou Wenbo*, Li Jingyao*. UDPBC: Uncertainty-guided dual-perspective behavior cloning for offline-to-online reinforcement learning. 2025. (Submitted)
Xiao Wei, Zhang Tao, Chen Huangyang, Li Jingyao*, Zhou Wenbo*. Q-bounded and adaptive Q-value constraints for offline-to-online reinforcement learning. 2025. (Submitted)
Chen Huangyang, Chen Juan, Zhang Tao, Sun Genghao, Lü Shuai*. Reward shaping based on trajectory quality for offline and hybrid reinforcement learning. 2025. (Submitted)

【荣誉奖励】

2020-2021学年，国家励志奖学金、二等奖学金、校三好学生
2021-2022学年，辽宁省政府奖学金、一等奖学金、校三好学生标兵
2022.05，美国大学生数学建模竞赛，国家级三等奖
2022.05，蓝桥杯全国软件和信息技术专业人才大赛，省级一等奖
2022.08，中国大学生计算机博弈大赛苏拉卡尔塔棋项目，国家级二等奖
2022-2023学年，一等奖学金、校三好学生标兵
2023.04，蓝桥杯全国软件和信息技术专业人才大赛，省级一等奖
2023.05，美国大学生数学建模竞赛，国家级二等奖
2024-2025学年，研究生学业奖学金

【联系方式】

邮箱：zhangtao24@mails.jlu.edu.cn
办公：吉林大学王湘浩楼B227室
地址：长春市前进大街2699号，130012

檀磊，男，2000年11月生，安徽省安庆市人。

2020.09-2024.06，安徽农业大学信息与计算机学院物联网工程专业，本科生（学业排名和综合排名均为第1/59名）
2024.09至今，吉林大学软件学院软件工程专业，推免硕士生（导师：吕帅教授、郭东教授）
研究方向：人工智能、机器学习

【学术论文和发明专利】在国内外期刊和会议上发表学术论文1篇，在审学术论文3篇，申请发明专利（目前实质审查）1项。

Tan Lei, Guo Dong, Fang Wensi, Li Guixiang, Yuan Jianhui, Zhang Xiaodan, Lü Shuai*. Divide and correct: Alternating normalization and prototype alignment for continual test-time adaptation. 2025. (Submitted)
Zhang Xiaodan, Fang Wensi, Tan Lei, Lü Shuai*. AutoVote: Adaptive learning rate modulation for continual test-time adaptation via sensitivity voting. 2025. (Submitted)
Yuan Jianhui, Zhang Xinyu, Li Guixiang, Tan Lei, Li Jingyao*, Zhou Wenbo*. GRACE: Enhancing source-free universal domain adaptation via gradient-aware contrastive learning and entropy-aware alignment. 2025. (Submitted).
马慧敏*, 檀磊, 张京会, 张鹏飞, 宁孝梅, 刘海秋, 高彦伟. 基于深度学习的合成孔径成像系统共相误差检测研究综述. 量子电子学报, 2022, 39(6): 927-941. (第一作者为指导教师)
檀磊, 马慧敏, 王小申, 戴明宇, 代腾辉, 焦俊, 刘倩, 辜丽川. 基于多尺度生成对抗网络的大气湍流图像复原方法及系统. (申请号: CN2023 1 1725750.0, 申请日: 2023.12.14, 目前实质审查)

【荣誉奖励】

2020-2021学年，特等奖学金、校三好学生
2021.11，中国互联网+大学生创新创业大赛，省级一等奖
2021-2022学年，特等奖学金、校三好学生、校自立自强大学生
2022.06，国际大学生智能农业装备创新大赛，国家级二等奖
2022.08，全国大学生生命科学竞赛，国家级一等奖
2022-2023学年，国家奖学金、一等奖学金
2023.06，中国大学生计算机设计大赛，省级一等奖
2024.12，中国研究生数学建模竞赛，国家级三等奖

【联系方式】

邮箱：tanlei24@mails.jlu.edu.cn
办公：吉林大学王湘浩楼B227室
地址：长春市前进大街2699号，130012

侯志斌，男，1999年08月生，山东省菏泽市人。

2017.09-2021.06，临沂大学信息科学与工程学院网络工程专业，本科生
2024.09至今，吉林大学软件学院软件工程专业，硕士生（导师：刘雪洁副教授、吕帅教授）
研究方向：人工智能、机器学习

【学术论文】在国内外期刊和会议上发表学术论文0篇，在审学术论文0篇。

【荣誉奖励】

2020.10，蓝桥杯全国软件和信息技术专业人才大赛，省级一等奖
2020.11，蓝桥杯全国软件和信息技术专业人才大赛全国总决赛，国家级一等奖
2021.05，中国高校计算机设计大赛团体程序设计天梯赛，团队国家二等奖、个人国家二等奖
2021.05，蓝桥杯全国软件和信息技术专业人才大赛，省级一等奖
2021.05，山东省大学生程序设计竞赛，省级金奖
2024.12，中国研究生数学建模竞赛，国家级三等奖

【联系方式】

邮箱：houzb24@mails.jlu.edu.cn
办公：吉林大学王湘浩楼B226室
地址：长春市前进大街2699号，130012

张顺浩，男，2002年03月生，山东省济南市人。

2020.09-2024.06，重庆理工大学车辆工程学院车辆工程[新能源及智能汽车教改班]专业，本科生
2020.09-2024.06，重庆理工大学计算机科学与工程学院计算机科学与技术专业（辅修），本科生
2024.09至今，吉林大学计算机科学与技术学院计算机科学与技术专业，硕士生（导师：刘雪洁副教授、吕帅教授）
研究方向：人工智能、机器学习

【学术论文】在国内外期刊和会议上发表学术论文0篇，在审学术论文1篇。

Wu Hao, Zhang Shunhao, Chen Huangyang, Zhang Tao, Zhou Wenbo*, Li Jingyao*. UDPBC: Uncertainty-guided dual-perspective behavior cloning for offline-to-online reinforcement learning. 2025. (Submitted)

【荣誉奖励】

2020-2021学年，国家励志奖学金、综合甲等奖学金
2021-2022学年，综合乙等奖学金
2022-2023学年，综合乙等奖学金

【联系方式】

邮箱：shunhao24@mails.jlu.edu.cn
办公：吉林大学王湘浩楼B226室
地址：长春市前进大街2699号，130012

巩锦程，男，2002年09月生，山东省淄博市人。

2021.09-2025.06，华北电力大学（保定）计算机系计算机科学与技术专业，本科生
预计2025.09开始，吉林大学软件学院软件工程专业，推免硕士生（导师：吕帅教授）
研究方向：人工智能、机器学习

【荣誉奖励】

2021-2022学年，国家励志奖学金、二等奖学金、校三好学生
2023-2024学年，国家励志奖学金、三等奖学金
2024.05，美国大学生数学建模竞赛，国家级一等奖

【联系方式】

邮箱：待学校分配
办公：吉林大学王湘浩楼B230室
地址：长春市前进大街2699号，130012

甄德杰，男，2003年05月生，河北省邢台市人。

2021.09-2025.06，河北大学数学与信息科学学院软件工程专业，本科生（学业排名和综合排名均为第1/86名）
预计2025.09开始，吉林大学软件学院软件工程专业，推免硕士生（导师：吕帅教授）
研究方向：人工智能、机器学习

【荣誉奖励】

2021-2022学年，国家励志奖学金、一等奖学金
2022-2023学年，国家励志奖学金、一等奖学金、校三好学生
2023.10，全国大学生数学建模竞赛，省级一等奖
2023-2024学年，国家励志奖学金、一等奖学金
2024.04，中国高校计算机设计大赛团体程序设计天梯赛，个人国家三等奖

【联系方式】

邮箱：待学校分配
办公：吉林大学王湘浩楼B230室
地址：长春市前进大街2699号，130012

钟金运，男，2003年06月生，江西省瑞金市人。

2021.09-2025.06，西南科技大学国防科技学院信息对抗技术专业，本科生（学业排名和综合排名均为第2/79名）
预计2025.09开始，吉林大学计算机科学与技术学院计算机科学与技术专业，推免硕士生（导师：吕帅教授）
研究方向：人工智能、机器学习

【荣誉奖励】

2022-2023学年，国家励志奖学金
2023.03，全国大学生数学竞赛，省级一等奖
2023-2024学年，国家励志奖学金
2024.03，攀拓计算机能力测评-程序设计（甲级），97/100分(44/338名)
2024.04，蓝桥杯全国软件和信息技术专业人才大赛，省级一等奖
2024.06，蓝桥杯全国软件和信息技术专业人才大赛全国总决赛，国家级三等奖
2024.09，攀拓计算机能力测评-程序设计（顶级），二等奖
2024.10，CCSP大学生计算机系统与程序设计竞赛，国家级铜奖

【联系方式】

邮箱：待学校分配
办公：吉林大学王湘浩楼B230室
地址：长春市前进大街2699号，130012

常钰，女，2003年01月生，辽宁省大连市人。

2021.09-2025.06，东北师范大学信息科学与技术学院计算机科学与技术专业，本科生
预计2025.09开始，吉林大学软件学院软件工程专业，推免硕士生（导师：吕帅教授）
研究方向：人工智能、机器学习

【荣誉奖励】

2021-2022学年，一等奖学金、校优秀学生
2022-2023学年，校长奖学金
2023.04，全国大学生市场调研与分析大赛，国家级三等奖
2023-2024学年，二等奖学金、校优秀学生干部
2024.07，中国大学生计算机设计大赛，国家级三等奖

【联系方式】

邮箱：待学校分配
办公：吉林大学王湘浩楼B230室
地址：长春市前进大街2699号，130012

姜文康，男，2003年07月生，山东省德州市人。

2021.09-2025.06，新疆大学软件学院软件工程专业，本科生
预计2025.09开始，吉林大学软件学院软件工程专业，推免硕士生（导师：吕帅教授）
研究方向：人工智能、机器学习

【荣誉奖励】

2021-2022学年，新疆维吾尔自治区人民政府励志奖学金
2022.05，蓝桥杯全国软件和信息技术专业人才大赛，省级一等奖
2022-2023学年，国家励志奖学金、校三好学生
2023.05，软件设计师（软考中级）

【联系方式】

邮箱：待学校分配
办公：吉林大学王湘浩楼B230室
地址：长春市前进大街2699号，130012

黄会敏，男，2004年03月生，山东省日照市人。

2022.09至今，吉林大学计算机科学与技术学院计算机科学与技术专业，本科生
预计2026.09开始，吉林大学计算机科学与技术学院计算机科学与技术专业，推免硕士生（导师：吕帅教授）
研究方向：人工智能、机器学习

【荣誉奖励】

2022-2023学年，一等奖学金、院优秀学生、院优秀学生干部
2023-2024学年，一等奖学金、院优秀学生、院优秀学生干部
2025.04，蓝桥杯全国软件和信息技术专业人才大赛，省级一等奖
2025.06，蓝桥杯全国软件和信息技术专业人才大赛全国总决赛，国家级三等奖

【联系方式】

邮箱：待学校分配
办公：吉林大学王湘浩楼B230室
地址：长春市前进大街2699号，130012