机器学习第八讲:向量/矩阵 → 数据表格的数学表达,如Excel表格转数字阵列
资料取自《零基础学机器学习》。
查看总目录:学习大纲
关于DeepSeek本地部署指南可以看下我之前写的文章:DeepSeek R1本地与线上满血版部署:超详细手把手指南
一、爬山GPS导航仪比喻 🧭(教材第八章引入案例1)
类比过程:
这个导航过程就是微积分中的「梯度下降」算法原理
二、火箭发射最佳角度解密 🚀
需求场景2:寻找发射角度θ使飞行高度最大
设高度公式:
H
(
θ
)
=
v
2
sin
2
θ
2
g
H(θ) = \frac{v^2 \sin^2θ}{2g}
H(θ)=2gv2sin2θ
求导找极值:
① 求导:
d
H
d
θ
=
v
2
sin
2
θ
g
\frac{dH}{dθ} = \frac{v^2 \sin2θ}{g}
dθdH=gv2sin2θ
② 令导数为0:
sin
2
θ
=
0
\sin2θ=0
sin2θ=0 ⇒
θ
=
4
5
∘
θ=45^\circ
θ=45∘
graph LR
A[初始角度30°] --> B[导数为正→需增大角度]
C[角度50°] --> D[导数为负→需减小角度]
B & D --> E[最优解45°]
三、核心运算工具箱 ⚙️
-
导数:变化率的显微镜
# 代码示例:计算函数在x=2处的导数 def f(x): return 3*x**2 + 2*x +1 h = 0.0001 # 极微小变化量 derivative = (f(2+h) - f(2))/h # 计算结果≈14
-
梯度下降流程图(教材第八章图例3)
四、AI训练实战模拟 🤖
场景:训练智能秤自动校正误差
损失函数:
L
(
w
)
=
(
真实重量
−
w
×
感应值
)
2
L(w) = (真实重量 - w×感应值)^2
L(w)=(真实重量−w×感应值)2
梯度下降步骤:
- 初始化权重w=0.8
- 计算梯度: d L d w = − 2 ( 真实值 − w × 感应值 ) × 感应值 \frac{dL}{dw} = -2(真实值 - w×感应值)×感应值 dwdL=−2(真实值−w×感应值)×感应值
- 更新公式: w 新 = w − 学习率 × 梯度 w_{新} = w - 学习率×梯度 w新=w−学习率×梯度
- 重复直到梯度接近于0
五、现实世界优化舞台 🌍
应用领域 | 优化目标 | 微积分工具 |
---|---|---|
电商定价策略 | 利润最大化 | 多元函数偏导数 |
物流路径规划 | 运输成本最小化 | 路径积分优化 |
手机自动亮度 | 耗电与舒适度的最佳平衡 | 约束条件极值 |
疫苗剂量试验 | 效果与副作用平衡点 | 微分方程平稳点 |
六、常见翻车现场警示 🚧(教材第八章误区4)
-
步长灾难
-
局部最优陷阱
就像掉进火山口以为到达地球最低点,实际还有马里亚纳海沟 -
维度诅咒
优化手机参数时涉及1000个变量 → 搜索空间比宇宙原子还多
七、高阶技巧补给站 ⛽️
动量加速法(教材第八章进阶内容5):
应用对比:
方法 | 迭代次数 | 收敛效果 |
---|---|---|
基础梯度下降 | 1500次 | 轻微震荡 |
动量加速法 | 400次 | 平稳快速 |
八、知识精髓总结 💎
微积分是量化决策的数学引擎,通过动态感知变化趋势引导系统不断逼近全局最优解(教材第八章核心结论1)
(典型案例:Tesla自动驾驶系统通过微分方程实时优化行驶轨迹🚗)
目录:总目录
上篇文章:机器学习第七讲:概率统计 → 预测可能性,下雨概率70%就是典型应用
下篇文章:机器学习第九讲:缺失值填补 → 补全问卷漏填的题目,保证数据完整性
《零基础学机器学习》第八章第一节"最优化本质",P.385 ↩︎ ↩︎
《零基础学机器学习》第八章案例8-3"航天器参数优化",P.402 ↩︎
《零基础学机器学习》第八章图8-7梯度下降流程图,P.414 ↩︎
《零基础学机器学习》第八章"优化算法陷阱",P.427 ↩︎
《零基础学机器学习》第八章动量加速推导,P.435 ↩︎