[数智金融] [3] 关于经济数据分析模块的大致思路

张开发

• 2026/4/10 4:30:43 • 15 分钟阅读

分享文章

前言TomySwift认为任何模块的构思过程都应该是有迹可循的。对于tomyswift来说主要的构思方式就是明确现在面临什么样的问题对于这些问题应该有什么样的解决方案。对于这些解决方案应该用什么样的测试标准筛选这些方案每一种方案有什么不确定的地方有待之后着手探索的。而在着手探索阶段tomyswift亦有对应的构思方法在这就不赘述了。面临的问题由于我们整个项目的基础是通用大模型如deepseek、豆包、Gemini和gpt等这些模型是由多方面的大量数据训练而成的虽然泛化能力比较强但是在单一的任务比如我们的金融投资策略生成任务中其对各类金融数据的理解与利用能力明显不足。主要体现于模型受相关机构发表的文章的引导比较严重提供的建议和相关文章、评论与博客中的建议高度重合对数据本身的理解不够深入以及忽视每只股票的差异性导致的提出的建议同质化非常严重的问题。解决方案tomyswift想用相关数据训练一个数据分析小模型或者微调已有的模型这里其实是2个方向单独为通用大模型生成投资策略提供几个用于参考的量化指标。tomyswift打算先从以下几个方面对这个小模型进行粗粒度的建模。1.训练数据根据实际情况考虑tomyswift打算基于聚宽平台提供的相关日频数据自己建立训练、验证和测试集如果效果好且条件允许的话考虑开源。其中每一条数据的基本格式如下输入特征真实标签其中输入特征中的指标既包含每支股票特有的日频指标也包含其他市场行为数据和宏观经济数据既有数字数据也有文本数据是多模态数据集。而标签只包含每只股票特有的日频指标。这里具体选哪些指标需要根据实际训练效果得出。tomyswift的目的就是用以上数据训练模型学会用股票过去的相关指标预测今后的指标为策略生成模块提供参考。2.模型架构选择这里tomyswift暂时无法确定哪种模型是最好的遂决定先提出大致合适的模型然后通过实验进行选择。以下是gpt和豆包分别提出的模型建议、当然tomyswift当然不会满足于以上的模型因为量化领域的好模型都是自己根据实际的数据研究出来的呢如果一味的参考别人的模型那岂不是所有人炒股都能赚钱了。所以tomyswift决定对以上模型进行架构上的创新因为tomyswift是cv领域出身的所以tomyswift一直想将恺明老师的某个思想融入我的模型进行联合训练呢这里由于一些原因等tomyswift做出来之后在告诉你融入的思想是什么呢。

[数智金融] [3] 关于经济数据分析模块的大致思路

最新文章

以专立基，以通致远——如何平衡特定任务优化与通用能力

OpenClaw+Qwen3.5-9B组合优势：3个不可替代的使用场景

原生Android工程与Unity互相调用

一道KMP统考真题彻底讲透：nextval与滑动距离的本质感

OpenClaw自动化测试：Phi-3-mini-128k-instruct批量验证API接口健壮性

数据存储与管理：QmlBook本地存储与SQL集成教程

推荐文章

CSS Scroll Snap：打造丝滑滚动体验

【2026年最新600套毕设项目分享】springboot高校学习讲座预约系统（14328）

STM32H7 USB复合设备库：CDC+MSC+SDMMC一体化固件

STM32异步Web服务器：零拷贝HTTP/WS工业网关实战

Linux命令-nc（用于设置路由器，是网络工具中的瑞士军刀）

【电池损耗+需求响应】考虑电池储能寿命与需求响应模型的发电计划优化程序Matlab代码

相关文章

2025 AI写作革命：自定义API打造专属小说生成器

用GDAL和PyTorch搞定多光谱.tif图像训练Faster R-CNN（避坑全记录）

HC-SR501人体红外传感器：从参数解析到树莓派实战应用

2026年三维扫描仪选购指南：专业厂家如何选，这几点是关键

微信小程序项目目录结构优化指南：从tabBar报错看最佳实践

探索Feishin：打造个人专属的自托管音乐播放解决方案

分享文章

更多文章

GitHub 热榜项目 - 日榜(2026-04-03)

告别过热烦恼！用开源神器为你的戴尔G15笔记本降温30%

三相电机控制中的端电压、相电压与线电压：测量方法与波形分析

AI安全新威胁：AnyAttack如何让一张‘猫图’骗过所有多模态大模型？

告别DataX和Sqoop！用Apache SeaTunnel 2.3.3搞定MySQL到Hive的同步（附完整配置文件）

Vue-pdf实现PDF文件流预览与分页控制的实战指南

避开这个坑！WPS2019添加VBA按钮的正确姿势（含宏录制技巧）

磷酸铁锂电池不同倍率测试避坑指南：为什么你的SOC估算不准？

Anthropic限制Claude订阅使用量以应对容量压力

想让AI看懂CAD图纸？别只靠GPT-4了，这份避坑指南和替代方案请收好

北京地区SEO优化与网站内容优化的关系如何_在北京做SEO优化需要注意哪些事项

NETDEV WATCHDOG: ethx (xxx): transmit queue 0 timed out 深度解析与实战修复