多元线性回归案例--客户价值模型

news2025/5/26 1:26:09

文章目录

        • step 1:读取数据
        • step 2:搭建模型
        • step 3:构造回归方程
        • step 4:评估模型

利用多元线性回归模型可以根据多个因素来预测客户价值,当模型搭建完成后,便可对不同价值的客户采用不同的业务策略。

这里以信用卡客户的客户价值为例来解释客户价值预测的具体含义:客户价值预测就是指预测客户在未来一段时间内能带来多少利润,其利润可能来自信用卡的年费、取现手续费、分期手续费、境外交易手续费等。分析出客户价值后,在进行营销、电话接听、催收、产品咨询等各项业务时,就可以针对高价值客户提供区别于普通客户的服务,以进一步挖掘高价值客户的价值,并提高客户的忠诚度。

step 1:读取数据

通过如下代码读取相关数据:

df = pd.read_excel('../../../data/ai/客户价值数据表.xlsx')
df.head()  # 显示前5行数据

X = df[['历史贷款金额', '贷款次数', '学历', '月收入', '性别']]
Y = df['客户价值']
print(df.head())
step 2:搭建模型

通过如下代码搭建线性回归模型:

#2.搭建线性模型
model=LinearRegression()
#使用特征X和目标变量Y对模型进行训练,学习如何拟合这些特征与目标变量之间的关系
model.fit(X,Y)
step 3:构造回归方程

通过如下代码查看线性回归方程的系数和常数项:

#3.线性回归方式构造
print('各系数为:'+str(model.coef_))
print('常数项系数k0为:'+str(model.intercept_))

输出结果如下:

各系数为:[5.71421731e-02 9.61723492e+01 1.13452022e+02 5.61326459e-02 1.97874093e+00]
常数项系数k0为:-208.42004079958383

这里通过regr.coef_获得的是一个系数列表,分别对应不同特征变量前面的系数,即k1、k2、k3、k4、k5,所以此时的多元线性回归方程如下:

$y = -208 + 0.057x_1 + 96x_2 + 113x_3 + 0.056x_4 + 1.98x_5 $

step 4:评估模型

评估搭建的多元线性回归模型,代码如下:

#4.模型评估
#在特征矩阵X中添加常数项,以便与截距进行线性回归分析
X2=sm.add_constant(X)
#使用最小二乘法拟合线性回归模型,Y是目标变量,X2是包含常数的特征矩阵
est=sm.OLS(Y,X2).fit()
#打印线性回归模型的统计摘要、包括系数、截距、拟合优度等
print(est.summary())

运行结果如下图:

image-20231221200141144

可以看到,模型的R-squared值为0.571,Adj.R-squared值为0.553,整体拟合效果不是特别好,可能是因为本案例的数据量偏少,不过在此数据量条件下也算可以接受的结果。再来观察P值,可以发现大部分特征变量的P值都较小,的确与目标变量(即“客户价值”)显著相关,而“性别”这一特征变量的P值达到了0.951,即与目标变量没有显著相关性,这个结论也符合经验认知,因此,在之后的建模中可以舍去“性别”这一特征变量。

本案例是在已知客户价值的前提下进行建模,如果在不知道客户价值(即不知道目标变量)的前提下进行建模,则属于非监督式机器学习的范畴,此时不能直接预测客户价值,不过可以利用数据聚类对客户进行分群,后面我们会具体讲解。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1355726.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C#高级语法 Attribute特性详解和类型,方法,变量附加特性讲解

文章目录 前言相关资料Attribute特性个人原理理解特性的声明与使用类型特性运行结果: 找到类的Attribute属性方法特性和变量特性代码封装测试类TestService1TestService2TestService3 测试代码运行结果 对封装的代码进行优化封装代码测试代码运行结果(和…

雾天条件下 SLS 融合网络的三维目标检测

论文地址:3D Object Detection with SLS-Fusion Network in Foggy Weather Conditions 论文代码:https://github.com/maiminh1996/SLS-Fusion 论文摘要 摄像头或激光雷达(光检测和测距)等传感器的作用对于自动驾驶汽车的环境意识…

3D 纹理的综合指南

在线工具推荐:3D数字孪生场景编辑器 - GLTF/GLB材质纹理编辑器 - 3D模型在线转换 - Three.js AI自动纹理开发包 - YOLO 虚幻合成数据生成器 - 三维模型预览图生成器 - 3D模型语义搜索引擎 我们经常看到超现实主义的视频游戏和动画电影角色出现在屏幕上。他们皮肤上的…

在win10上cuda12+tensorrt8.6+vs2019环境下编译paddle2.6生成python包与c++推理库

paddle infer官方目前没有发布基于cuda12的c库,为此参考https://www.paddlepaddle.org.cn/inference/user_guides/source_compile.html实现cuda12的编译安装,不料博主才边缘好自己的paddle2.6,paddle官方已经发布了cuda12.0的paddle2.6框架。…

嵌入式MCU:如何安装codeWarrior 和Jlink

先安装codeWarrior 15.0版本,这个官网上没有这个版本要去blazar的这个网站上下载: Blazar-α系统电路图纸(MOOC课程对应)(Updating)-Blazar开源硬件与MOOC codeWarrior 安装不要安装在中文路径里面 安装完了codeWarrior 再安装Jlink 然后再装Jlink 这个也是从上面的…

Android 内容生成pdf文件

1.引入itext7 implementation com.itextpdf:itext7-core:7.1.13上面比较大,可以直接下载需要集成的jar包 implementation files(libs\\layout-7.1.13.jar) implementation files(libs\\kernel-7.1.13.jar) implementation files(libs\\io-7.1.13.jar) implementatio…

《MySQL系列-InnoDB引擎04》MySQL表相关介绍

文章目录 第四章 表1 索引组织表2 InnoDB逻辑存储结构2.1 表空间2.2 段2.3 区2.4 页2.5 行2.6 拓展:MySQL的varchar(n)能存储几个字符?占多少字节? 3 InnoDB行记录格式4 文件格式5 约束5.1 数据完整性5.2 约束的创建和查找5.3 约束和索引的区…

如何为项目创建高效的项目进度表?

项目管理是一项负有巨大责任的工作,涉及到完成项目所需的大量流程和任务。如果没有任务和责任的线路图,很容易就偏离方向,无法了解项目每个阶段需要完成的任务。这就是为什么项目进度表是成功执行项目的核心所在。 什么是项目进度表&#xff…

数据分析-24-母婴产品电商可视化分析(包含代码数据)

文章目录 0. 代码数据获取1. 项目1.1 项目介绍1.2 分析目的1.3 分析思路 2. 数据集介绍2.1 数据信息2.2 字段含义 3. 数据清洗3.1 导入包和查看数据3.2 查看列的信息3.3 查看表平均值这些3.4 查出重复的user_id3.5 清洗buy_mount列 4. 针对目的进行分析4.1 销量数量前10的类别I…

T40N 君正智能处理器T40 BGA 芯片

T40N是一款智能视频应用处理器,适用于移动摄像机、安防等视频设备调查、视频聊天、视频分析等。该SoC引入了一种创新的体系结构满足高性能计算和高质量图像和视频编码的要求通过视频设备解决。T40N提供高速CPU计算能力,出色的图像信号过程中,…

ensp vlan连接(详细)

1.将需要的设备放置好 2.将设备连接起来 3.启动所有设备 4.备注好每台PC机的信息 5.配置好每台PC机 6.配置交换机1 进入配置视图,关闭信息提示 重命名设备 批量创建VLAN 开始配置接口 更改接口类型为ACCESS 将接口划分到对应的VLANN 配置下一个接口,步…

JavaScript高级程序设计读书记录(一):语言基础,语法,变量,数据类型

1. 语法 很大程度上借鉴了 C 语言和其他类 C 语言,如 Java 和 Perl. 1.1 区分大小写 1.2 标识符 第一个字符必须是一个字母、下划线(_)或美元符号($); 剩下的其他字符可以是字母、下划线、美元符号或数…

qiankun 公共依赖

1、提取公共依赖的目的 减少相同资源的重复加载资源版本不同步打包文件庞大2、如何提取公共依赖 基本思路:1、相同依赖 采用 CDN 的方式加载,并把 所有依赖的 CDN 链接 统一放到一个文件中进行管理 2、把存放 CDN 链接的文件,引入到 vue.conf…

NFT 项目入驻 NFTScan Site 流程说明

NFTScan Site 是由数据基础设施 NFTScan 推出的功能强大的 NFT 项目管理平台。NFTScan Site 主要为 NFT Collection、NFT Marketplace、NFTFi 以及其他 NFT 生态项目提供专业的项目管理后台服务和链上数据分析追踪服务。 NFTScan Site 功能: 1)项目信息编…

华硕ASUS RT-AC1200 pandavan老毛子 128M DDR固件

原版硬件只支持64M DDR2,更换了128M内存,结果找不到对应的固件,而且全部都是英文版的 所以自己编译了中文版的pandavan老毛子,下载位置可能资源审核中:

基于Kettle开发的web版数据集成开源工具(data-integration)-部署篇

目录 📚第一章 前言📗背景📗目的📗总体方向 📚第二章 下载编译📗下载📗编译 📚第三章 部署📗准备工作📕 安装数据库&redis&consul📕 修改…

树莓派控制继电器(IO的配置和使用)

一、硬件函数初始化 int wiringPiSetup(void)返回:执行状态,-1表示失败 当使用这个函数初始化树莓派引脚时,程序使用的是wiringPi 引脚编号表。引脚的编号为 0~16 需要root权限 二、配置IO口的模式 void pinMode (int pin, int …

算法31:针对算法30货币问题进行拓展 + 时间复杂度 + 空间复杂度优化--------从左往右尝试模型

在算法30中,我们说过从左往右尝试模型,口诀就是针对固定集合,就是讨论要和不要的累加和。 那么对于非固定集合,我们应该怎么做呢? 针对非固定集合,面值固定,张数不固定。口诀就是讨论要与不要…

URLConnection()和openStream()两个方法产生SSRF的原理和修复方法

今年是自主研发的第三个年份,也是重视安全的年份。 转一篇小文章: 0x00 前言 SSRF 形成的原因大都是由于服务端提供了从其他服务器应用获取数据的功能且没有对目标地址做过滤与限制。比如从指定 URL 地址获取网页文本内容,加载指定地址的图…

《算法导论》复习——CHP1、CHP2 算法基础

基本定义: 算法是一组有穷的规则,规定了解决某一特定类型问题的一系列运算。 关心算法的正确性和效率。 算法的五个重要特性:确定性、能行性、输入、输出、有穷性。 基础方法: 伪代码(Pseudocode)&#xff…