线性回归——工龄与平均工资关系分析
项目实训工龄与平均工资关系分析项目实训1. 实训目的1理解数据分析的过程。2掌握机器学习常用库NumPy、Pandas、Matplotlib的使用方法。3掌握使用Sklearn训练线性回归模型并进行预测的方法。2. 实训内容已知某公司员工工龄与平均工资之间有一定的相关关系见表2-5要求使用线性回归法分析平均工资与工龄的关系。表2-5 工龄与平均工资数据集工龄/年平均工资/元工龄/年平均工资/元12000610567222007956634900815678432219136445683410157891启动Jupyter Notebook以Python 3工作方式新建Jupyter Notebook文档并重新命名为“item2-sx.ipynb”。2数据准备① 导入NumPy库。② 使用NumPy定义两个数组分别存放工龄数据与平均工资数据。3训练线性回归模型① 导入线性回归模型LinearRegression。② 使用LinearRegression建立基于工龄与平均工资数据集的线性回归模型。③ 训练线性回归模型。4绘制图像① 导入Matplotlib库。② 定义图像的标题为“工龄与平均工资之间的关系图”。③ 定义图像的横坐标为“工龄/年”纵坐标为“平均工资/元”。④ 将步骤②和③中出现的中文字体设置为黑体。⑤ 使用scatter()函数绘制原始数据点。# 1. 导入所需库importnumpyasnpfromsklearn.linear_modelimportLinearRegressionimportmatplotlib.pyplotasplt# 2. 数据准备# 定义工龄数组转换为二维数组适配sklearnxnp.array([1,2,3,4,5,6,7,8,9,10]).reshape(-1,1)# 定义平均工资数组ynp.array([2000,2200,4900,3221,6834,10567,9566,15678,13644,15789])# 3. 训练线性回归模型modelLinearRegression()model.fit(x,y)# 得到预测值y_predmodel.predict(x)# 4. 绘制图像# 设置中文字体为黑体plt.rcParams[font.sans-serif][SimHei]plt.rcParams[axes.unicode_minus]False# 绘制原始数据散点图plt.scatter(x,y,colorblue,label原始数据)# 绘制线性回归拟合直线plt.plot(x,y_pred,colorred,labelf拟合直线: y {model.coef_[0]:.2f}x {model.intercept_:.2f})# 设置图表标题与坐标轴标签plt.title(工龄与平均工资之间的关系图)plt.xlabel(工龄/年)plt.ylabel(平均工资/元)# 显示图例与图表plt.legend()plt.show()# 输出模型参数print(f线性回归系数{model.coef_[0]:.2f})print(f线性回归截距{model.intercept_:.2f})最终线性回归方程y≈1706.03x396.57\boldsymbol{y \approx 1706.03x 396.57}y≈1706.03x396.57保留两位小数✅
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2502581.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!