多智能体强化学习驱动的智股协同决策研究-期刊刊文-新加坡图文科学出版社官网

多智能体强化学习驱动的智股协同决策研究

ISSN：2982-3382

EISSN：

语言：中文

作者

吴泽龙,廖思晴,杨晓雯,王枝宁

文章摘要

针对传统股票投资决策方法在高波动性、多因素耦合的金融市场中面临的挑战，提出了一种基于多智能体强化学习（MARL）的智股协同决策引擎。系统采用分层多智能体架构，集成七大功能智能体，涵盖数据采集、多模态分析、协同决策与策略执行全流程。通过融合新闻舆情分析、K线图像识别、动态风险量化多源信息，构建了包含状态空间、动作空间与分层奖励函数的MARL模型，并引入跨模态注意力机制实现异构数据深度融合。实验基于A股市场数据，采用集中训练与分布式执行范式进行模型训练。研究表明，多智能体协同机制有效提升了投资决策的收益能力和风险控制水平，为投资决策从经验驱动向数据智能驱动的转型提供了一种技术路径。

文章关键词

多智能体；强化学习；智股协同决策；跨模态注意力机制；年化夏普比率

参考文献

[1] 杜威,丁世飞.多智能体强化学习综述[J].计算机科学,2019,46(08):1-8. [2] 殷昌盛,杨若鹏,朱巍,等.多智能体分层强化学习综述[J].智能系统学报,2020,15(04):646-655. [3] 齐甜方,蒋洪迅. 基于Seq2Seq文本摘要和情感挖掘的股票波动趋势预测[J].管理评论,2021,33(05):257-269. [4] 李承奥.基于机器强化学习与蒙特卡洛树的基本原理及其应用[J].通讯世界,2019,26(02):212-213. [5] 黎麟玉.基于强化学习的股票自动交易策略研究[D].哈尔滨工业大学,2024. [6] 邹启杰,蒋亚军,高兵,等.协作多智能体深度强化学习研究综述[J].航空兵器,2022,29(06):78-88. [7] 任泽裕,王振超,柯尊旺,等.多模态数据融合综述[J].计算机工程与应用,2021,57(18):49-64. [8] 刘一鸣.基于奖励设计的深度强化学习算法研究与应用[D].北京邮电大学,2020.

Full Text:

点击下载PDF

DOI