文科生小白入门AI量化:每天2小时,3个月跑通人生第一个LSTM模型
这是《AI量化学习手记》系列的第一篇文章。在这个系列里我会以学习者的视角记录从零开始学AI量化的真实经历——踩过的坑、填过的土、试过的方法、翻过的车。不讲大道理只分享真问题。今天这篇是我入门3个月的真实复盘希望能给同样刚起步的你一点参考。引言那个永远在“收藏”的我2025年底我被朋友拉进他的“量化小黑屋”——满屏跳动的K线、实时滚动的成交数据、角落里默默跑着的模型。“这些都是AI在交易。”他说。我盯着屏幕脑子里冒出的第一个问题是我一个文科生、数学停留在高中、编程零基础的人能学会这个吗换作以前我会立刻打开知乎收藏几十篇“AI量化学习路线图”买几本推荐的书然后……就没有然后了。熟悉的循环收藏从未停止学习从未开始。这一次我决定换一种方式。不囤资料、不列完美计划而是直接开始。每天下班后挤出2小时用AI工具辅助我一步步往前走。3个月后我竟然跑通了自己的第一个LSTM模型——虽然被朋友吐槽“拟合了噪音”但这个过程让我彻底摆脱了“收藏家”的循环。这篇文章就是我的“通关笔记”分享给同样想入门、又怕坚持不下来的你。一、入门三问数学、编程、金融到底要学到什么程度网上关于这个问题的说法五花八门有的说“线代概率必须精通”有的说“会用库就行”。其实每个人的基础不同根本没有统一标准。我是文科生每天能挤出来的时间就2小时必须找到适合自己的路。我的答案是不用等学完再动手直接“干中学”。设定一个具体目标比如“用LSTM预测茅台第二天的涨跌”然后直接开干。遇到数学问题就补数学遇到编程问题就学编程遇到金融概念就查金融。哪里卡住补哪里不用一口气吃成胖子。二、我的核心武器用AI工具搭建学习体系2.1 创建专属AI导师我用的工具是DeepSeek。关键不是工具而是提示词。这是我给自己写的“AI导师”提示词模板分享给你## 角色 你是一位资深的AI量化导师擅长用通俗易懂的方式指导零基础小白。你精通Python、机器学习、金融知识但从不直接给答案而是引导我思考和动手。 ## 我的背景 - 文科生数学停留在高中编程零基础。 - 上班族每天学习时间有限2小时左右。 - 第一个目标是用LSTM预测茅台(600519.SH)第二天的涨跌。 ## 你的任务 1. 帮我拆解这个目标列出需要一步步完成的任务清单。 2. 每当我完成一个任务告诉我下一个做什么。 3. 当我卡住时不要直接给代码而是解释原理引导我尝试。 4. 定期帮我复盘总结学到的知识点避免碎片化。 ## 对话风格 - 耐心、鼓励但不过度夸奖。 - 多用比喻少用术语。 - 随时准备解释我不懂的概念。有了这个导师我再也不用纠结“下一步该学什么”了。他会像项目经理一样带着我一步步往前走。2.2 NotebookLM我的私人知识库“干中学”有个天然缺陷知识容易碎片化。今天学LSTM输入格式明天学数据清洗后天学回测评估……如果不整理过两周就忘。我用NotebookLM来解决这个问题。这是Google的一个实验性工具可以创建多个笔记本每个笔记本相当于一个专属知识库。我的操作步骤创建一个“AI量化”笔记本。把所有能找到的资料都扔进去下载的PDF书籍比如Ernest Chan的《量化交易》、收藏的博客文章、B站视频的文字稿、甚至自己写的笔记。用DeepResearch功能挖掘权威素材。当我对某个概念比如“三重屏障法”一头雾水时我会用以下提示词让AI帮我深度搜索请为我深度挖掘关于“三重屏障法Triple Barrier Method”的权威资料要求 1. 原始出处找到提出该方法的论文或书籍Marcos López de Prado。 2. 核心原理用通俗语言解释这个方法解决了什么问题怎么做的。 3. 代码实现找到高质量的Python实现GitHub或知名博客。 4. 社区评价技术社区对该方法的真实讨论正反面观点。 5. 学习建议对我这样的初学者应该学到什么程度需要掌握哪些前置知识搜到的结果论文PDF、博客网页、GitHub仓库全部保存下来上传到NotebookLM。利用内置模型提问和总结。资料都放进去后我再用以下提示词让AI提炼核心知识点你正在协助我处理一份关于“三重屏障法”的DeepResearch报告。请基于报告内容提炼出以下信息以便我存入Notion知识库 1. 核心思想一句话总结 2. 解决的问题 3. 具体步骤/原理 4. 代码实现要点关键函数或库 5. 社区共识正反面评价 6. 学习优先级对初学者的建议 7. 相关前置知识清单 8. 延伸阅读推荐1-2个这样一来我不需要自己啃完整本书就能快速获取核心知识点。而且因为是基于我自己的资料库回答完全不用担心AI胡编乱造。2.3 Notion AI沉淀我的知识大厦NotebookLM负责“查”和“快速学习”Notion AI负责“存”和“体系化”。我按照AI导师的建议先在Notion里搭建了一个完整的知识框架。这个框架不是空架子而是填充了每个学科最核心的20%知识点——这些知识点能覆盖80%的应用场景。【数学篇】核心概念核心概念一句话说明在量化中的应用向量、矩阵运算数据的基本表示矩阵乘法用于特征组合所有模型的基础如因子加权特征值与特征向量矩阵分解的核心用于降维PCA因子模型、风险模型随机变量、期望、方差描述数据的分布和不确定性收益分布、风险评估条件概率、贝叶斯定理基于新信息更新信念贝叶斯统计、贝叶斯优化导数与偏导数函数的变化率梯度下降的基础模型训练优化链式法则复合函数求导反向传播的核心深度学习训练【编程篇】核心技能核心技能一句话说明掌握程度Python基础数据类型、列表推导式、函数编程入门基础能写简单脚本PandasDataFrame操作、groupby、时间序列数据处理核心必须熟练NumPy数组运算、广播机制科学计算基础会用即可Scikit-learnfit/predict、交叉验证机器学习基础理解流程PyTorch张量、自动求导、构建简单网络深度学习框架按需学习【金融篇】核心概念核心概念一句话说明为什么重要订单类型市价/限价/止损不同类型的交易指令影响执行成本和滑点买卖价差、流动性市场深度和交易成本高频策略的生命线未来函数前瞻偏差回测中使用了未来数据回测虚高的主要原因幸存者偏差只考虑存活股票导致的偏差回测结果失真过拟合模型死记硬背历史数据实盘崩溃的元凶最大回撤、夏普比率风险收益核心指标评估策略好坏【模型篇】常用模型模型一句话说明适用场景线性回归最简单的预测模型因子预测、收益率预测随机森林/XGBoost树模型非线性拟合能力强分类问题、因子挖掘LSTM处理时间序列的循环神经网络价格预测、波动率预测Transformer注意力机制模型复杂时序依赖建模DQN/PPO强化学习模型交易执行优化这个框架不是一次性建好的而是随着学习不断填充。每天学完后我会花15分钟把新学的知识点填进对应的Notion页面。Notion AI还可以帮我自动生成复习卡片提醒我哪些内容需要巩固。三、数据获取第一个绕不开的现实问题路线图再完美第一步就卡住了——数据从哪来我刚开始天真地以为数据不就是一个API的事吗试了一圈才发现这里面的坑比想象的多。下面是国内主流数据源的详细对比希望能帮你少走弯路。数据源核心优势接入方式注意事项适用场景Tushare Pro- 数据清洗极好字段标准统一- 覆盖A股全品类股票、基金、期货、期权- 提供财务数据、特色因子1. 官网注册获取token2.pip install tushare3. 在代码中设置token- 需要积分可通过注册、充值或贡献数据获取- 普通用户每分钟请求限制- 2025年8月曾发生近一周服务中断基本面量化、需要高质量数据的回测、学术研究AKShare- 完全免费无需积分- 覆盖极广包括股票、基金、期货、宏观数据甚至一些奇葩数据如大宗商品库存1.pip install akshare2. 直接调用接口如ak.stock_zh_a_hist()- 本质是爬虫不稳定随时可能因网站改版失效- 速度慢不适合高并发- 实时数据延迟高约500ms盘后研究、另类数据挖掘、学习用途、免费替代方案Baostock- 无需注册直接可用- 数据稳定性高很少缺失或错误- 提供财务报表和财务指标1.pip install baostock2. 登录bs.login()后获取数据- 分钟级数据有限只有最近几天- 历史长度不足部分数据只有几年- 文档较少中长期基本面策略研究、数据交叉验证JoinQuant- 一站式平台提供数据、回测、模拟盘- 社区活跃有很多现成策略- 数据质量有保障1. 官网注册2. 在平台内直接使用支持本地SDK下载- 2025年涨价后年费接近千元- 本地使用有限制新手快速上手、不想自己搭回测框架的人TickDB- 30天免费试用全品类数据开放- 一套API覆盖A股、美股、港股、外汇、贵金属、指数、加密货币- 数据质量高有预处理前复权、异常过滤- 国内节点优化延迟低1. 官网注册获取API Key2.pip install tickdbSDK3. 调用接口- 历史深度不如专业数据商但日线足够- 付费方案尚未公布试用期先爽个人开发者实盘、跨市场策略、从免费过渡到付费的场景四、我的“干中学”实操全流程供参考如果你也想试试这个方法这是我的完整流程设定一个具体目标我用的是用LSTM预测茅台次日涨跌创建AI导师使用上面的提示词模板搭建Notion知识框架先建空架子填充核心知识点启动NotebookLM素材库把所有资料扔进去用DeepResearch补充跟着导师开始干每一步遇到问题先问导师需要深入的概念用DeepResearch搜权威资料存入NotebookLM学到的知识点分类填充到Notion框架每周复盘让导师帮我总结本周学到的东西更新知识框架写在最后最大的坑是你自己有位前辈说过一句话我印象特别深“我最大的错误是花了几个月在回测中完善策略而不是尽早在模拟盘中向前运行。策略在历史数据上表现完美是因为它在死记硬背。”这句话提醒我不要等到“准备好”再开始因为你永远不可能准备好。与其花几个月囤资料、定计划不如现在就动手用AI工具辅助你边做边学。如果你也对这套方法感兴趣欢迎留言告诉我。文章里提到的AI导师提示词、DeepResearch提示词、Notion知识框架模板我后续可以整理出来分享。一起加油从“收藏从未停止”到“学习真正开始”。本文核心观点速读版放弃“收藏式学习”转向“干中学”设定目标用AI导师指导实操用NotebookLMDeepResearch搭建专属素材库快速获取权威知识用Notion AI搭建知识框架沉淀核心知识点数学、编程、金融、模型数据源对比Tushare质量好但需积分、AKShare免费但爬虫、Baostock稳定但数据有限、JoinQuant一站式但贵、TickDB新手友好30天免费试用最大的坑是自己别过度准备尽早动手
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2422332.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!