机器学习算法:线性回归

news2025/5/29 5:09:30

1. 基础概念

线性回归是一种用于建模连续型目标变量(如价格、销量、温度)与一个或多个特征变量(如面积、广告投入、时间)之间线性关系的统计方法。

  • 核心思想:找到一条直线(或超平面),使得预测值与真实值的误差最小。

数学形式:

  • 简单线性回归:y = w*x + b

    • y:目标变量(如房价)

    • x:特征变量(如房屋面积)

    • w:权重(斜率),b:偏置(截距)

  • 多元线性回归:y = w₁x₁ + w₂x₂ + ... + wₙxₙ + b

    • 多个特征共同预测目标(如面积、房间数、地段共同预测房价)。


2. 核心原理

损失函数:均方误差(MSE)

衡量预测值与真实值的差距: MSE = (1/N) * Σ(y_true - y_pred)² 目标是最小化MSE,找到最优的wb

优化方法:梯度下降

通过迭代调整参数wb,逐步降低损失函数的值(类似“下山找最低点”)。

评估指标
  • R²(决定系数):模型解释数据变异的比例,越接近1越好。

  • 均方误差(MSE):越小越好。


3. 实际生产中的例子

案例1:房价预测
  • 场景:房地产平台根据历史数据预测房屋售价。

  • 特征:面积、房间数、地段评分、房龄。

  • 输出:房价(连续值)。

  • 应用:用户输入房屋信息后,自动生成估价报告。

案例2:电商销售额预测
  • 场景:预测某商品的月度销售额。

  • 特征:广告投入、促销力度、季节性指数、竞品价格。

  • 输出:销售额(连续值)。

  • 应用:优化广告预算分配,制定促销策略。

案例3:能源消耗预测
  • 场景:工厂预测电力消耗以降低能源成本。

  • 特征:生产线数量、工作时间、室外温度。

  • 输出:每小时用电量。

  • 应用:动态调整用电计划,避开用电高峰。

案例4:用户行为分析(互联网)
  • 场景:预测用户在某APP上的停留时长。

  • 特征:用户点击次数、页面加载速度、推荐内容相关性。

  • 输出:停留时间(分钟)。

  • 应用:优化推荐算法,提升用户留存。


4. 生产中的改进方法

处理非线性关系
  • 多项式回归:将特征转换为高次项(如, ),拟合曲线。

    • 例如:广告投入与销售额可能呈“边际递减”曲线关系。

正则化(防止过拟合)
  • 岭回归(Ridge):对权重w的平方(L2范数)进行惩罚。

  • Lasso回归:对权重w的绝对值(L1范数)进行惩罚,可自动筛选重要特征。

特征工程
  • 归一化/标准化:加速梯度下降收敛。

  • 处理缺失值:填充均值或中位数。

  • 异常值处理:剔除或缩尾。


5. 优缺点

优点
  • ✅ 简单、高效、可解释性强(权重反映特征重要性)。

  • ✅ 适合小数据集或低维特征场景。

  • ✅ 可作为复杂模型(如神经网络)的基准参考。

缺点
  • ❌ 假设特征与目标呈线性关系,难以捕捉复杂模式。

  • ❌ 对异常值和多重共线性敏感。

  • ❌ 特征需人工设计,无法自动学习高阶交互。


6. 代码工具示例(Python)


7. 适用场景总结

  • 推荐使用线性回归:

    • 特征与目标关系近似线性

    • 需要快速验证业务假设(如广告投入是否影响销量)。

    • 结果需可解释(如向业务部门汇报“面积对房价的影响”)。

  • 避免使用:

    • 数据高度非线性(如图像、音频)。

    • 特征维度极高且存在多重共线性。


一句话总结

线性回归是“用直线拟合数据”的经典方法,虽简单但广泛应用于工业界,尤其在需要快速验证和解释性的场景中。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2387039.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

常见小问题(Open Folder as PyCharm Project)

1.删除pycharm鼠标右键快捷键打开项目 winr键打开,输入regedit,运行注册器 找到下面的路径:计算机\HKEY_CLASSES_ROOT\Directory\Background\shell\PyCharm 删除即可

第四十四节:目标检测与跟踪-模板匹配

一、引言 模板匹配的核心思想是通过在输入图像中搜索与预定义模板最相似的区域来定位目标。这种方法计算效率高、实现简单,特别适用于目标外观变化不大且背景相对简单的场景。本文将深入探讨模板匹配的原理、OpenCV中的实现方法、优化技巧以及实际应用案例。 二、模板匹配基础…

vue+ThreeJs 创建过渡圆圈效果

嗨,我是小路。今天主要和大家分享的主题是“vueThreeJs 创建过渡圆圈效果”。 今天在做着色器过渡效果练习,发现出现了很多新的函数,这些都超出了js之外,需要更多的掌握和学习。以下是自己的复盘和梳理。 1.获取距离 定…

MySQL:12_视图

视图 跟事务里讲的视图没有任何关系 视图是一个虚拟表,其内容由查询定义。同真实的表一样,视图包含一系列带有名称的列和行数据。视图的数据变化会影响到基表,基表的数据变化也会影响到视图。 一.基本使用 创建视图 create view 视图名 …

win11+vs2022 安装opencv 4.11.0图解教程

1. 下载opencv opencv官网下载地址:Releases - OpenCV 2. 双击运行该exe,即可进行安装,安装文件夹可自行选择 安装后目录如下: 3. 配置环境变量 使用win键搜索环境变量,选中系统变量中的Path,然后点击编辑…

n8n 读写本地文件

1.Docker Desktop 创建容器 docker run -d --name n8n -p 5566:5678 -v D:\docker\n8n_data:/home/node/.n8n -v D:\docker\n8n_files:/home/node/Files n8nio/n8n:latest 参数说明: 1.-d :表示以 detached 模式运行容器(后台运行) 2.--name n8n :指定容器名称为n8n。 3.-p 55…

LlamaFirewall:开源框架助力检测与缓解AI核心安全风险

LlamaFirewall 是一款面向大语言模型(LLM)应用的系统级安全框架,采用模块化设计支持分层自适应防御。该框架旨在缓解各类AI代理安全风险,包括越狱攻击(jailbreaking)、间接提示注入(indirect pr…

java基础知识回顾3(可用于Java基础速通)考前,面试前均可用!

目录 一、基本算数运算符 二、自增自减运算符 三、赋值运算符 四、关系运算符 五、逻辑运算符 六、三元运算符 七、 运算符的优先级 八、小案例:在程序中接收用户通过键盘输入的数据 声明:本文章根据黑马程序员b站教学视频做的笔记,可…

电脑无法识别打印机usb设备怎么办 一键解决!

在当今高度数字化的工作环境中,打印机作为重要的办公设备之一,承担着文件打印、扫描等关键任务。然而,有时我们可能会遇到一个令人头疼的问题——电脑无法识别通过USB连接的打印机。这种情况不仅会影响工作效率,还可能打断正常的工…

Elasticsearch Synthetic _source

_source 字段包含索引时传入的原始 JSON 文档体。_source 字段本身不被索引(因此不可搜索),但会被存储,以便在执行获取请求(如 get 或 search)时返回。 如果磁盘使用很重要,可以考虑以下选项&a…

C++ -- vector

vector 1. 关于vector1.1 对比原生数组1.2 vector的核心优势 2. 扩容2.1 底层实现2.2 扩容过程 3. 构造函数4. 接口模拟实现4.1 实现迭代器4.2 扩容4.3 重载[]4.4 插入和删除4.5 构造函数和析构函数 5. 迭代器失效5.1 扩容后失效5.2 越界失效 6. 深浅拷贝 1. 关于vector 1.1 对…

深入研究Azure 容器网络接口 (CNI) overlay

启用cni overlay 在通过portal创建aks的时候,在networking配置上,选中下面的选项即可启用。 通过CLI创建AKS 要创建具有 CNI 覆盖网络的 AKS 群集,需要在创建群集时指定 --network-plugin azure 和 --network-plugin-mode 覆盖选项。 还需要指定 --pod-cidr 选项来定义群…

Python打卡第37天

浙大疏锦行 早停策略和模型权重的保存 作业:对信贷数据集训练后保存权重,加载权重后继续训练50轮,并采取早停策略 import torch import torch.nn as nn import pandas as pd import matplotlib.pyplot as plt import torch.optim as optim fr…

使用 OpenCV 构建稳定的多面镜片墙效果(镜面反射 + Delaunay 分块)

✨ 效果概览 我们将实现一种视觉效果,模拟由许多小镜面拼接而成的“镜子墙”。每个镜面是一个三角形区域,其内容做镜像反射(如水平翻转),在视频中形成奇特的万花筒、哈哈镜、空间折叠感。 使用 OpenCV 实现“随机镜面…

HTTP协议版本的发展(HTTP/0.9、1.0、1.1、2、3)

目录 HTTP协议层次图 HTTP/0.9 例子 HTTP/1.0 Content-Type 字段 Content-Encoding 字段 例子 1.0版本存在的问题:短链接、队头阻塞 HTTP/1.1 Host字段 Content-Length 字段 分块传输编码 1.1版本存在的问题 HTTP/2 HTTP/2数据传输 2版本存在的问题…

零基础设计模式——结构型模式 - 桥接模式

第三部分:结构型模式 - 桥接模式 (Bridge Pattern) 在学习了适配器模式如何解决接口不兼容问题后,我们来看看桥接模式。桥接模式是一种更侧重于系统设计的模式,它旨在将抽象部分与其实现部分分离,使它们可以独立地变化。 核心思…

SpringBoot3集成Oauth2.1——4集成Swagger/OpenAPI3

文章目录 访问在线文档页面配置OpenApiConfig 在我之前的文章中&#xff0c;写了 SpringBoot3集成OpenAPI3(解决Boot2升级Boot3) 访问在线文档页面 当我们同样在SpringBoot3使用oauth2.1也就是我之前的文章中写的。现在我们要处理下面这两个的问题了。 <!-- 使用springdoc…

基于深度学习的情绪识别检测系统【完整版】

最近很多小伙伴都在咨询&#xff0c;关于基于深度学习和神经网络算法的情绪识别检测系统。回顾往期文章【点击这里】&#xff0c;介绍了关于人脸数据的预处理和模型训练&#xff0c;这里就不在赘述。今天&#xff0c;将详细讲解如何从零基础手写情绪检测算法和情绪检测系统。主…

Redis学习打卡-Day7-高可用(下)

前面提到&#xff0c;在某些场景下&#xff0c;单实例存Redis缓存会存在的几个问题&#xff1a; 写并发&#xff1a;Redis单实例读写分离可以解决读操作的负载均衡&#xff0c;但对于写操作&#xff0c;仍然是全部落在了master节点上面&#xff0c;在海量数据高并发场景&#x…

博奥龙Nanoantibody系列IP专用抗体

货号名称BDAA0260 HRP-Nanoantibody anti Mouse for IP BDAA0261 AbBox Fluor 680-Nanoantibody anti Mouse for IP BDAA0262 AbBox Fluor 800-Nanoantibody anti Mouse for IP ——无轻/重链干扰&#xff0c;更高亲和力和特异性 01Nanoantibody系列抗体 是利用噬菌体展示纳…