案例之 逻辑回归_癌症预测
案例使用 逻辑回归模型 实现癌症预测逻辑回归模型介绍1.概述属于有监督学习即有特征、有标签、且标签是离散的。主要适用于二分类2.原理把线性回归处理后的预测值–通过Sigmoid激活函数映射到[0, 1]概率–基于自定义的阈值结合概率来分类3.损失函数极大似然估计函数的 负数形式 案例演示逻辑回归模型实现癌症预测 逻辑回归模型介绍 概述属于有监督学习即有特征、有标签、且标签是离散的。主要适用于二分类。 原理把线性回归处理后的预测值--通过Sigmoid激活函数映射到[0, 1]概率--基于自定义的阈值结合概率来分类 损失函数极大自然估计函数的 负数形式 机器学习开发流程 1.加载数据 2.数据的预处理 3.特征工程特征提取、特征与处理、特征降维、特征选择、特征组合 4.模型训练 5.模型预测 6.模型评估 # 导包importnumpyasnpimportpandasaspdfromsklearn.linear_modelimportLogisticRegression#逻辑回归模型fromsklearn.metricsimportaccuracy_scorefromsklearn.preprocessingimportStandardScaler#标准化fromsklearn.model_selectionimporttrain_test_split#训练集和测试集分割fromday02.案例之波士顿房价预测_正规方程法importtransfer# from sklearn.metrics import accuracy_score #模型评估# 1.加载数据datapd.read_csv(data/breast-cancer-wisconsin.csv)# data.info()# 2.数据的预处理# 2.1 把 ? 替换成np.nan参1要被替换的值参2用来替换的值参3是否替换源数据默认为Falsedatadata.replace(?,np.nan,inplaceTrue)# 2.2 确实值处理--》删除data.dropna(axis0,inplaceTrue)#axis0表示行删除包含缺省值的行确定axis0表示行还是列一般源方法都是默认按行删除点进原方法看axis等于几# 2.3 打印处理后的信息# data.info()# 3.特征工程特征提取、特征与处理、特征降维、特征选择、特征组合# 3.1 特征提取之 提取特征和标签xdata.iloc[:,1:-1]#按照行号、列索引获取数据: 表示所有行1:-1表示从第1列到最后一列包左不包右# ydata.iloc[:, -1] #获取最后一列# ydata[Class] #获取最后一列效果同上ydata.Class.values#获取最后一列效果同上# 3.2 查看特征和标签print(x[:5])print(y[:5])print(f特征{x.shape}, 标签{y.shape})#特征(683, 9), 标签(683,)# 3.3切割训练集和测试集x_train,x_test,y_train,y_testtrain_test_split(x,y,test_size0.2,random_state23)# 3.4 特征工程标准化# 3.4.1 创建标准化对象transferStandardScaler()# 3.4.2 对训练集进行标准化处理x_traintransfer.fit_transform(x_train)# 3.4.3 对测试集进行标准化处理x_testtransfer.transform(x_test)# 4.模型训练# 4.1 创建模型对象 --》逻辑回归对象estimatorLogisticRegression()# 4.2 模型训练estimator.fit(x_train,y_train)# 5.模型预测y_predictestimator.predict(x_test)print(f预测结果{y_predict})# 6.模型评估# 正确率准确率公式为预测对的/ 样本总数print(f预测前评估正确率{estimator.score(x_test,y_test)})#测试集的特征、标签print(f预测后评估正确率{accuracy_score(y_test,y_predict)})#测试集的标签、预测值# 思考逻辑回归模型能用 准确率来评测吗# 答案:可以但是结果不精准因为逻辑回归模型主要用于 二分类即:A类还是B类不能说 97%的A类3%的B类# 所以要通过 混淆矩阵来评测即:精确率召回率F1值(F1-Score)ROC曲线AUC值.
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2565901.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!