多智能体强化学习驱动的智股协同决策研究

ISSN:2982-3382

EISSN:

语言:中文

作者
吴泽龙,廖思晴,杨晓雯,王枝宁
文章摘要
针对传统股票投资决策方法在高波动性、多因素耦合的金融市场中面临的挑战,提出了一种基于多智能体强化学习(MARL)的智股协同决策引擎。系统采用分层多智能体架构,集成七大功能智能体,涵盖数据采集、多模态分析、协同决策与策略执行全流程。通过融合新闻舆情分析、K线图像识别、动态风险量化多源信息,构建了包含状态空间、动作空间与分层奖励函数的MARL模型,并引入跨模态注意力机制实现异构数据深度融合。实验基于A股市场数据,采用集中训练与分布式执行范式进行模型训练。研究表明,多智能体协同机制有效提升了投资决策的收益能力和风险控制水平,为投资决策从经验驱动向数据智能驱动的转型提供了一种技术路径。
文章关键词
多智能体;强化学习;智股协同决策;跨模态注意力机制;年化夏普比率
参考文献
[1] 杜威,丁世飞.多智能体强化学习综述[J].计算机科学,2019,46(08):1-8. [2] 殷昌盛,杨若鹏,朱巍,等.多智能体分层强化学习综述[J].智能系统学报,2020,15(04):646-655. [3] 齐甜方,蒋洪迅. 基于Seq2Seq文本摘要和情感挖掘的股票波动趋势预测[J].管理评论,2021,33(05):257-269. [4] 李承奥.基于机器强化学习与蒙特卡洛树的基本原理及其应用[J].通讯世界,2019,26(02):212-213. [5] 黎麟玉.基于强化学习的股票自动交易策略研究[D].哈尔滨工业大学,2024. [6] 邹启杰,蒋亚军,高兵,等.协作多智能体深度强化学习研究综述[J].航空兵器,2022,29(06):78-88. [7] 任泽裕,王振超,柯尊旺,等.多模态数据融合综述[J].计算机工程与应用,2021,57(18):49-64. [8] 刘一鸣.基于奖励设计的深度强化学习算法研究与应用[D].北京邮电大学,2020.
Full Text:
DOI