个人信息

姓  名: 陈兴国 性  別: 导师类型: 硕士生导师
技术职称: 副教授 电子邮箱: chenxg@njupt.edu.cn
学术型硕士招生学科: (081200)计算机科学与技术
专业型硕士招生类别(领域): (085404)计算机技术
photo

个人简介:

陈兴国(1984年生),江苏南通人,分别于2007年、2013年获得南京大学计算机科学与技术系学士、博士学位,2014年加入南京邮电大学计算机学院,2015年获得硕士生导师资格。现任南京邮电大学智能博弈研究组(GameAI Research Group@NJUPT)负责人。研究成果获得2017吴文俊人工智能科学技术奖”-自然科学二等奖,2018江苏省科学技术奖”-自然科学二等奖。作为主要发起人,分别于2014年、2022年创建了南京邮电大学教职工网球协会、南京邮电大学教职工掼蛋协会,任首届副会长。2020年至2021年,承办两届掼蛋游戏AI算法竞赛。


本科生课程包括:离散数学、数据结构、操作系统、Java语言程序设计、实践课程(算法与数据结构设计、专业课程设计I、专业课程设计II)

研究生、博士生课程包括:强化学习


审稿人: 

IEEE TNNLSTKDETISTMachine LearningAtmospheric Pollution ResearchEnvironmental Research、软件学报、电子学报、计算机学报、自动化学报、AAAI、ECAI





研究领域:

研究方向包括: 机器学习,强化学习,深度学习,智能博弈(Machine Learning, Reinforcement Learning, Deep Learning, Game AI

 研究课题包括但不限于:

1、强化学习算法的理论分析和设计优化,如收敛性分析、收敛速度分析,针对非稳定性、非遍历性、无环性等问题的算法设计

2、掼蛋、Tetris、2048、空中格斗等游戏AI算法设计与实现

3、大语言模型、强化学习等技术在网络自动化攻防的运用

4、机器学习在国家电网、环境科学(大气、水)、地球科学、生物科学的应用,如不平衡分类、时序预测、回归、推荐等







科研项目:



1、  国家自然科学基金-面上项目:“广度优先强化学习理论及应用”(课题年限:20232026) 

2、  国家自然科学基金-青年项目:基于值函数估计的强化学习算法研究” (课题年限:20152017) 







代表性学术成果:

更多详细信息请见谷歌学术主页(https://scholar.google.com/citations?user=d7AoedYAAAAJ)

人工智能博弈研究组主页(https://gameai.njupt.edu.cn/)

 

[1]   Guang Yang, Zheng Xu, Jing Huo, Shangdong Yang, Tianyu Ding, Xingguo Chen, Yang Gao. "State Abstraction via Deep Supervised Hash Learning." IEEE TNNLS (2024).

[2]   Xingguo Chen, Wangrong Qin, Yu Gong, Shangdong Yang, and Wenhao Wang. On Convergence Rate of MRetrace. Mathematics 2024, 12, 2930.

[3]   Wenhao Wang, Xingguo Chen, Yuwei Li, and Cheng Zhu. Catch the Cyber Thief: A Multi-Dimensional Asymmetric Network Attack–Defense Game. Applied Sciences, 2024, 14(20): 9234.

[4]   杨尚东, 余淼盈, 陈兴国, 陈蕾. 基于分组对比学习的序贯感知技能发现方法. 软件学报.2024.

[5]   董绍康,李超,杨光,葛振兴,曹宏业,陈武兵,杨尚东,陈兴国,李文斌,高阳. 混合博弈问题的求解与应用. 软件学报.2024.

[6]   陈兴国, 吕咏洲, 巩宇, 陈耀雄. 基于贝叶斯优化的强化学习广义不动点解逼近. 山东大学学报, 2024, 54(4): 21-34.

[7]   Yongfeng Deng, Ruqin Shen, Xue Zhang, Yang Li, Xingguo Chen, Rong-Rong He, Hao Tian, Shuqin Tang, Xiang Luo, Jing Li, Wan-Yang Sun, Hongli Tan. Invisible hazards: Exploring neonicotinoid contamination and its environmental risks in urban parks across China. Science of The Total Environment, 2024, 954: 176715.

[8]   Xingguo Chen, Xingzhou Ma, Yang Li, Guang Yang, Shangdong Yang and Yang Gao, Modified Retrace for Off-Policy Temporal Difference Learning, Conference on Uncertainty in Artificial Intelligence, 2023: 303-312 (CAAI A, CCF B).

[9]   Xingguo Chen, Yang Gao, and Ruili Wang, Online selective kernel-based temporal difference learning, IEEE TNNLS, 24(12): 1944-1956, 2013. SCI一区, CCF B

[10]   Xingguo Chen, Guang Yang, Shangdong Yang, et al. Online attentive kernel-based temporal difference learning. Knowledge-Based Systems, 2023, 278: 110902 (CAAI B, CCF C).

[11]   陈兴国,孙丁源昊,杨光,杨尚东,高阳. 不动点视角下的强化学习算法综述. 计算机学报, 2023, 46(6):1246-1271.

[12]   Xingguo Chen, Zening Chen, Dingyuanhao Sun, Yang Gao. Backtracking Exploration for Reinforcement Learning. Proceedings of the Fifth International Conference on Distributed Artificial Intelligence. 2023: 1-7.

[13]   张斐斐,葛季栋,李忠金,黄子峰,张胜,陈兴国,骆斌. 边缘计算中协作计算卸载与动态任务调度. 软件学报, 2023, 34(12): 5737-5756.

[14]   Wenhao Wang, Dingyuanhao Sun, Feng Jiang, Xingguo Chen, Cheng Zhu. Research and challenges of reinforcement learning in cyber defense decision-making for intranet security. Algorithms, 2022, 15(4): 134.

[15]   Guang Yang, Yang Li, Tian Huang, Qingyun Li, Xingguo Chen. DHQN: a stable approach to remove target network from deep q-learning network. 2021 IEEE 33rd International Conference on Tools with Artificial Intelligence (ICTAI). IEEE, 2021: 1474-1479.

[16]   Yong Liu, Weixun Wang, Yujing Hu, Jianye Hao, Xingguo Chen, Yang Gao; Multi-Agent Game Abstraction via Graph Attention Neural Network. AAAI 2020: 7211-7218. (CCF-A)

[17]   Kangyang Chen; Hexia Chen; Chuanlong Zhou; Yichao Huang; Xiangyang Qi; Ruqin Shen; Fengrui Liu; Min Zuo; Xinyi Zou; Jinfeng Wang; Yan Zhang; Da Chen; Xingguo Chen*; Yongfeng Deng*; Hongqiang Ren; Comparative analysis of surface water quality prediction performance and identification of key water parameters using different machine learning models based on big data, Water Research2020(171). SCI一区,高被引)

[18]   Chen, Xingguo, Houtao Liu, Fengrui Liu, Tian Huang, Ruqin Shen, Yongfeng Deng, Da Chen. "Two novelty learning models developed based on deep cascade forest to address the environmental imbalanced issues: A case study of drinking water quality prediction." Environmental Pollution 291 (2021): 118153. SCI二区)

[19]   Kangyang Chen, Xinyi Zou, Xingguo Chen, Huihui Wang, An Automated Online Spam Detector Based on Deep Cascade Forest, SciSec 2019.

[20]   Feifei Zhang, Jidong Ge, Chifong Wong, Chuanyi Li, Xingguo Chen, Sheng Zhang, Bin Luo, He Zhang, Victor Chang. Online learning offloading framework for heterogeneous mobile edge computing system, Journal of Parallel and Distributed Computing, 2019, 128: 167-183. (CCF-B)

[21]   Fan Feng, Jikai Wu, Wei Sun, Yushuang Wu, HuaKang Li, Xingguo Chen. Haze forecasting via deep LSTM. APWEB 2018. (CCF-C)

[22]   Shangdong Yang, Yang Gao, Bo An, Hao Wang, and Xingguo Chen, Efficient Average Reward Reinforcement Learning Using Constant Shifting Values, AAAI 2016. (CCF-A)

[23]   陈兴国,俞扬. 强化学习及其在电脑围棋中的应用.自动化学报, 2016, 42(5):685-695.

[24]   Wang, Hao, Yang Gao, and Xingguo Chen. RL-dot: A reinforcement learning NPC team for playing domination games. IEEE Transactions on Computational Intelligence and AI in Games (TCIAIG), 2010, 2(1): 17-26. (CCF-C)

[25]   Xingguo Chen, Hao Wang, Weiwei Wang, Yinghuan Shi, and Yang Gao. Apply ant colony optimization to Tetris. GECCO 2009. (CCF-C)

[26]   王皓,高阳,陈兴国强化学习中的迁移:方法和进展电子学报强化学习中的迁移:方法和进展电子学报.36(12A): 39-43, 2008.

 






指导的优秀研究生代表:

l  2025

   颖 阿里巴巴-上海
陆灵凤 字节跳动-上海
江宛真 华为-北京
陈钰浩 江苏省电信-南京
罗镇宇 华为-苏州
   宇 南京宇天智云仿真-南京

 

l  2024

张浩年 电信-杭州
张帅强 小米-南京
陈泽宁 上海宇量昇
秦旺荣 上海宇量昇
蒋新成 常山北明
李昕闻 无锡先进技术研究院
   静 华为OD-南京

 

l  2023届级及之前

   琳 莆田学院老师
吕咏洲 南京宇天智云仿真
 扬 东南大学计算机学院读博
孙丁源昊 南京大学商学院读博候选

刘厚涛 满帮集团-南京

吴多丰 中兴微电子股份有限公司-深圳

   洁 中兴-南京

徐修颖 中国工商银行数据中心-上海

杨  光 南京大学计算机学院读博