[数智金融] [3] 关于经济数据分析模块的大致思路

张开发
2026/4/10 4:30:43 15 分钟阅读

分享文章

[数智金融] [3] 关于经济数据分析模块的大致思路
前言TomySwift认为任何模块的构思过程都应该是有迹可循的。对于tomyswift来说主要的构思方式就是明确现在面临什么样的问题对于这些问题应该有什么样的解决方案。对于这些解决方案应该用什么样的测试标准筛选这些方案每一种方案有什么不确定的地方有待之后着手探索的。而在着手探索阶段tomyswift亦有对应的构思方法在这就不赘述了。面临的问题由于我们整个项目的基础是通用大模型如deepseek、豆包、Gemini和gpt等这些模型是由多方面的大量数据训练而成的虽然泛化能力比较强但是在单一的任务比如我们的金融投资策略生成任务中其对各类金融数据的理解与利用能力明显不足。主要体现于模型受相关机构发表的文章的引导比较严重提供的建议和相关文章、评论与博客中的建议高度重合对数据本身的理解不够深入以及忽视每只股票的差异性导致的提出的建议同质化非常严重的问题。解决方案tomyswift想用相关数据训练一个数据分析小模型或者微调已有的模型这里其实是2个方向单独为通用大模型生成投资策略提供几个用于参考的量化指标。tomyswift打算先从以下几个方面对这个小模型进行粗粒度的建模。1.训练数据根据实际情况考虑tomyswift打算基于聚宽平台提供的相关日频数据自己建立训练、验证和测试集如果效果好且条件允许的话考虑开源。其中每一条数据的基本格式如下输入特征真实标签其中输入特征中的指标既包含每支股票特有的日频指标也包含其他市场行为数据和宏观经济数据既有数字数据也有文本数据是多模态数据集。而标签只包含每只股票特有的日频指标。这里具体选哪些指标需要根据实际训练效果得出。tomyswift的目的就是用以上数据训练模型学会用股票过去的相关指标预测今后的指标为策略生成模块提供参考。2.模型架构选择这里tomyswift暂时无法确定哪种模型是最好的遂决定先提出大致合适的模型然后通过实验进行选择。以下是gpt和豆包分别提出的模型建议、当然tomyswift当然不会满足于以上的模型因为量化领域的好模型都是自己根据实际的数据研究出来的呢如果一味的参考别人的模型那岂不是所有人炒股都能赚钱了。所以tomyswift决定对以上模型进行架构上的创新因为tomyswift是cv领域出身的所以tomyswift一直想将恺明老师的某个思想融入我的模型进行联合训练呢这里由于一些原因等tomyswift做出来之后在告诉你融入的思想是什么呢。

更多文章