文科生小白入门AI量化:每天2小时,3个月跑通人生第一个LSTM模型

news2026/3/18 8:46:40
这是《AI量化学习手记》系列的第一篇文章。在这个系列里我会以学习者的视角记录从零开始学AI量化的真实经历——踩过的坑、填过的土、试过的方法、翻过的车。不讲大道理只分享真问题。今天这篇是我入门3个月的真实复盘希望能给同样刚起步的你一点参考。引言那个永远在“收藏”的我2025年底我被朋友拉进他的“量化小黑屋”——满屏跳动的K线、实时滚动的成交数据、角落里默默跑着的模型。“这些都是AI在交易。”他说。我盯着屏幕脑子里冒出的第一个问题是我一个文科生、数学停留在高中、编程零基础的人能学会这个吗换作以前我会立刻打开知乎收藏几十篇“AI量化学习路线图”买几本推荐的书然后……就没有然后了。熟悉的循环收藏从未停止学习从未开始。这一次我决定换一种方式。不囤资料、不列完美计划而是直接开始。每天下班后挤出2小时用AI工具辅助我一步步往前走。3个月后我竟然跑通了自己的第一个LSTM模型——虽然被朋友吐槽“拟合了噪音”但这个过程让我彻底摆脱了“收藏家”的循环。这篇文章就是我的“通关笔记”分享给同样想入门、又怕坚持不下来的你。一、入门三问数学、编程、金融到底要学到什么程度网上关于这个问题的说法五花八门有的说“线代概率必须精通”有的说“会用库就行”。其实每个人的基础不同根本没有统一标准。我是文科生每天能挤出来的时间就2小时必须找到适合自己的路。我的答案是不用等学完再动手直接“干中学”。设定一个具体目标比如“用LSTM预测茅台第二天的涨跌”然后直接开干。遇到数学问题就补数学遇到编程问题就学编程遇到金融概念就查金融。哪里卡住补哪里不用一口气吃成胖子。二、我的核心武器用AI工具搭建学习体系2.1 创建专属AI导师我用的工具是DeepSeek。关键不是工具而是提示词。这是我给自己写的“AI导师”提示词模板分享给你## 角色 你是一位资深的AI量化导师擅长用通俗易懂的方式指导零基础小白。你精通Python、机器学习、金融知识但从不直接给答案而是引导我思考和动手。 ## 我的背景 - 文科生数学停留在高中编程零基础。 - 上班族每天学习时间有限2小时左右。 - 第一个目标是用LSTM预测茅台(600519.SH)第二天的涨跌。 ## 你的任务 1. 帮我拆解这个目标列出需要一步步完成的任务清单。 2. 每当我完成一个任务告诉我下一个做什么。 3. 当我卡住时不要直接给代码而是解释原理引导我尝试。 4. 定期帮我复盘总结学到的知识点避免碎片化。 ## 对话风格 - 耐心、鼓励但不过度夸奖。 - 多用比喻少用术语。 - 随时准备解释我不懂的概念。有了这个导师我再也不用纠结“下一步该学什么”了。他会像项目经理一样带着我一步步往前走。2.2 NotebookLM我的私人知识库“干中学”有个天然缺陷知识容易碎片化。今天学LSTM输入格式明天学数据清洗后天学回测评估……如果不整理过两周就忘。我用NotebookLM来解决这个问题。这是Google的一个实验性工具可以创建多个笔记本每个笔记本相当于一个专属知识库。我的操作步骤创建一个“AI量化”笔记本。把所有能找到的资料都扔进去下载的PDF书籍比如Ernest Chan的《量化交易》、收藏的博客文章、B站视频的文字稿、甚至自己写的笔记。用DeepResearch功能挖掘权威素材。当我对某个概念比如“三重屏障法”一头雾水时我会用以下提示词让AI帮我深度搜索请为我深度挖掘关于“三重屏障法Triple Barrier Method”的权威资料要求 1. 原始出处找到提出该方法的论文或书籍Marcos López de Prado。 2. 核心原理用通俗语言解释这个方法解决了什么问题怎么做的。 3. 代码实现找到高质量的Python实现GitHub或知名博客。 4. 社区评价技术社区对该方法的真实讨论正反面观点。 5. 学习建议对我这样的初学者应该学到什么程度需要掌握哪些前置知识搜到的结果论文PDF、博客网页、GitHub仓库全部保存下来上传到NotebookLM。利用内置模型提问和总结。资料都放进去后我再用以下提示词让AI提炼核心知识点你正在协助我处理一份关于“三重屏障法”的DeepResearch报告。请基于报告内容提炼出以下信息以便我存入Notion知识库 1. 核心思想一句话总结 2. 解决的问题 3. 具体步骤/原理 4. 代码实现要点关键函数或库 5. 社区共识正反面评价 6. 学习优先级对初学者的建议 7. 相关前置知识清单 8. 延伸阅读推荐1-2个这样一来我不需要自己啃完整本书就能快速获取核心知识点。而且因为是基于我自己的资料库回答完全不用担心AI胡编乱造。2.3 Notion AI沉淀我的知识大厦NotebookLM负责“查”和“快速学习”Notion AI负责“存”和“体系化”。我按照AI导师的建议先在Notion里搭建了一个完整的知识框架。这个框架不是空架子而是填充了每个学科最核心的20%知识点——这些知识点能覆盖80%的应用场景。【数学篇】核心概念核心概念一句话说明在量化中的应用向量、矩阵运算数据的基本表示矩阵乘法用于特征组合所有模型的基础如因子加权特征值与特征向量矩阵分解的核心用于降维PCA因子模型、风险模型随机变量、期望、方差描述数据的分布和不确定性收益分布、风险评估条件概率、贝叶斯定理基于新信息更新信念贝叶斯统计、贝叶斯优化导数与偏导数函数的变化率梯度下降的基础模型训练优化链式法则复合函数求导反向传播的核心深度学习训练【编程篇】核心技能核心技能一句话说明掌握程度Python基础数据类型、列表推导式、函数编程入门基础能写简单脚本PandasDataFrame操作、groupby、时间序列数据处理核心必须熟练NumPy数组运算、广播机制科学计算基础会用即可Scikit-learnfit/predict、交叉验证机器学习基础理解流程PyTorch张量、自动求导、构建简单网络深度学习框架按需学习【金融篇】核心概念核心概念一句话说明为什么重要订单类型市价/限价/止损不同类型的交易指令影响执行成本和滑点买卖价差、流动性市场深度和交易成本高频策略的生命线未来函数前瞻偏差回测中使用了未来数据回测虚高的主要原因幸存者偏差只考虑存活股票导致的偏差回测结果失真过拟合模型死记硬背历史数据实盘崩溃的元凶最大回撤、夏普比率风险收益核心指标评估策略好坏【模型篇】常用模型模型一句话说明适用场景线性回归最简单的预测模型因子预测、收益率预测随机森林/XGBoost树模型非线性拟合能力强分类问题、因子挖掘LSTM处理时间序列的循环神经网络价格预测、波动率预测Transformer注意力机制模型复杂时序依赖建模DQN/PPO强化学习模型交易执行优化这个框架不是一次性建好的而是随着学习不断填充。每天学完后我会花15分钟把新学的知识点填进对应的Notion页面。Notion AI还可以帮我自动生成复习卡片提醒我哪些内容需要巩固。三、数据获取第一个绕不开的现实问题路线图再完美第一步就卡住了——数据从哪来我刚开始天真地以为数据不就是一个API的事吗试了一圈才发现这里面的坑比想象的多。下面是国内主流数据源的详细对比希望能帮你少走弯路。数据源核心优势接入方式注意事项适用场景Tushare Pro- 数据清洗极好字段标准统一- 覆盖A股全品类股票、基金、期货、期权- 提供财务数据、特色因子1. 官网注册获取token2.pip install tushare3. 在代码中设置token- 需要积分可通过注册、充值或贡献数据获取- 普通用户每分钟请求限制- 2025年8月曾发生近一周服务中断基本面量化、需要高质量数据的回测、学术研究AKShare- 完全免费无需积分- 覆盖极广包括股票、基金、期货、宏观数据甚至一些奇葩数据如大宗商品库存1.pip install akshare2. 直接调用接口如ak.stock_zh_a_hist()- 本质是爬虫不稳定随时可能因网站改版失效- 速度慢不适合高并发- 实时数据延迟高约500ms盘后研究、另类数据挖掘、学习用途、免费替代方案Baostock- 无需注册直接可用- 数据稳定性高很少缺失或错误- 提供财务报表和财务指标1.pip install baostock2. 登录bs.login()后获取数据- 分钟级数据有限只有最近几天- 历史长度不足部分数据只有几年- 文档较少中长期基本面策略研究、数据交叉验证JoinQuant- 一站式平台提供数据、回测、模拟盘- 社区活跃有很多现成策略- 数据质量有保障1. 官网注册2. 在平台内直接使用支持本地SDK下载- 2025年涨价后年费接近千元- 本地使用有限制新手快速上手、不想自己搭回测框架的人TickDB- 30天免费试用全品类数据开放- 一套API覆盖A股、美股、港股、外汇、贵金属、指数、加密货币- 数据质量高有预处理前复权、异常过滤- 国内节点优化延迟低1. 官网注册获取API Key2.pip install tickdbSDK3. 调用接口- 历史深度不如专业数据商但日线足够- 付费方案尚未公布试用期先爽个人开发者实盘、跨市场策略、从免费过渡到付费的场景四、我的“干中学”实操全流程供参考如果你也想试试这个方法这是我的完整流程设定一个具体目标我用的是用LSTM预测茅台次日涨跌创建AI导师使用上面的提示词模板搭建Notion知识框架先建空架子填充核心知识点启动NotebookLM素材库把所有资料扔进去用DeepResearch补充跟着导师开始干每一步遇到问题先问导师需要深入的概念用DeepResearch搜权威资料存入NotebookLM学到的知识点分类填充到Notion框架每周复盘让导师帮我总结本周学到的东西更新知识框架写在最后最大的坑是你自己有位前辈说过一句话我印象特别深“我最大的错误是花了几个月在回测中完善策略而不是尽早在模拟盘中向前运行。策略在历史数据上表现完美是因为它在死记硬背。”这句话提醒我不要等到“准备好”再开始因为你永远不可能准备好。与其花几个月囤资料、定计划不如现在就动手用AI工具辅助你边做边学。如果你也对这套方法感兴趣欢迎留言告诉我。文章里提到的AI导师提示词、DeepResearch提示词、Notion知识框架模板我后续可以整理出来分享。一起加油从“收藏从未停止”到“学习真正开始”。本文核心观点速读版放弃“收藏式学习”转向“干中学”设定目标用AI导师指导实操用NotebookLMDeepResearch搭建专属素材库快速获取权威知识用Notion AI搭建知识框架沉淀核心知识点数学、编程、金融、模型数据源对比Tushare质量好但需积分、AKShare免费但爬虫、Baostock稳定但数据有限、JoinQuant一站式但贵、TickDB新手友好30天免费试用最大的坑是自己别过度准备尽早动手

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2422332.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…