星空体育·(China)官方网站-登录入口

讲师

当前位置: 首页 > 师资队伍 > 软件系 > 讲师 > 正文

赵阳洋

发布时间: 2023-10-30 14:43:50 浏览量:

登录入口计算机学院研究生导师基本信息表

1、个人基本信息：

姓名：赵阳洋

性别：女

出生年月：1995.12

技术职称：讲师

毕业院校：华南理工大学

学历（学位）：博士

所在学科：软件工程

研究方向：强化学习、大模型、人机交互

2、教育背景：

2017.09----2022.12

华南理工大学大学

博士

2021.11----2022.11

Utrecht University

联合培养博士

3、 目前研究领域：

强化学习、大模型、人机交互

4、已完成或已在承担的主要课题：

1、基于大模型和强化学习的任务驱动-情绪感知型对话策略研究，湖南省自然科学基金面上项目青年项目，主持，5万

2、基于端云融合的网联协同控制关键技术研究及应用，广东省重点领域研发计划项目，新一代人工智能专项，参与，10000万

3、面向在线社会网络的信息传播结构分析与宏观预测，广东省基础与应用基础研究基金，面上项目，参与，10万元

4、基于大数据分析的移动音乐智能搜索与推荐平台，广州市科技计划项目，广州市产业技术重大攻关计划-现代产业技术专题项目，参与，1400万元

5、面向移动互联网用户大数据分析及推荐平台的产业化应用，广东省应用型科技研发专项资金项目重点项目，参与，400万元

5、已出版的主要著作：

6、已发表的学术论文：

[1] Yangyang Zhao, Jinchuan Long*, Mehdi Dastani, Shihan Wang. Rescue Conversations from Dead-ends: Efficient Exploration for Task-oriented Dialogue Policy

Optimization. Transactions of the Association for Computational Linguistics, 2024. (TACL，一区TOP期刊)

[2] Yangyang Zhao, Hua Qin, Zhenyu Wang, Mehdi Dastani*, Shihan Wang*. Decomposed Deep-Q Network for Efficient Dialogue Policy Learning. IEEE Trans. Audio, Speech, and Lang. Process. (TASLP，一区TOP期刊)

[3]Yangyang Zhao, Ben Niu, Mehdi Dastani*, Shihan Wang*. Bootstrapped Policy Learning for Task-oriented Dialogue through Goal Shaping. EMNLP 2024. (CCF-B)

[4] Yangyang Zhao, Mehdi Dastani*, Shihan Wang*. Bootstrapped Policy Learning: Goal Shaping for Efficient Task-oriented Dialogue Policy Learning. AAMAS 2024. (CCF-B)

[5] Yangyang Zhao, Zhenyu Wang*, Zhenhua Huang. Automatic Curriculum Learning With Over-repetition Penalty for Dialogue Policy Learning. AAAI 2021. (CCF-A)

[6] Yangyang Zhao, Zhenyu Wang*, Kai Yin, Rui Zhang, Zhenhua Huang, Pei Wang. Dynamic Reward-based Dueling Deep Dyna-Q: Robust Policy Learning in Noisy Environments. AAAI 2020.oral (CCF-A)

[7] Yangyang Zhao, Zhenyu Wang *, Changxi Zhu, Shihan Wang. Complementary Policy Learning from Episodic Memory Policy and DQN Policy. EMNLP 2021. (CCF-B)

[8] Yangyang Zhao, Hua Qin, Zhenyu Wang*, Changxi Zhu, Shihan Wang*. A Versatile Adaptive Curriculum Learning Framework for Task-oriented Dialogue Policy Learning. NAACL 2022. (CCF-B)

[9] 赵阳洋，王振宇*，王佩，杨添，张睿，尹凯. 任务型对话系统研究综述. 计算机学报, 2020, 43(10): 1862-1896. (CCF-T1)

7、 所获学术荣誉及学术影响：

指导研究生学生获奖情况：
“华为杯”中国研究生人工智能创新大赛（2024）（全国二等奖）

湖南省研究生计算机创新大赛（2024）（湖南省一等奖，优秀指导老师）

指导本科生获奖情况：

中国大学生服务外包创新大赛（2024）（全国二等奖）

中国机器人及人工智能大赛（2024）（全国二等奖）

蓝桥杯数字科技创新赛（2024）（全国三等奖）

中国大学生计算机设计大赛（2024）（中南赛区一等奖）

海峡两岸暨港澳地区大学生计算机创新作品赛（2024）（湖南省三等奖）

学术兼职：
中文信息学会，计算机学会会员

ACL, EMNLP, NAACL, COLING, AAAI，IJCAI等人工智能及自然语言处理领域顶级会议审稿人

上一篇：乃科

下一篇：徐聪