龙空技术网

Python机器学习之波士顿房价预测(三)

乐上轻至 343

前言:

此时小伙伴们对“python房价预测用到什么框架”大体比较关怀,朋友们都需要学习一些“python房价预测用到什么框架”的相关知识。那么小编同时在网络上汇集了一些对于“python房价预测用到什么框架””的相关文章,希望各位老铁们能喜欢,看官们快快来了解一下吧!

线性回归预测房价

文章目录

波士顿房价数据集背景介绍获取scikit-learn框架数据集创建机器学习模型获取测试集正确率

波士顿房价数据集背景介绍

波士顿房价数据集是统计的20世纪70年代中期波士顿郊区房价的中位数,统计了当时教区部分的犯罪率、房产税等共计13个指标,统计出房价,试图能找到那些指标与房价的关系。本例子明显的是属于回归模型的案例。在数据集中包含506组数据,其中404是训练样本,剩下的102组数据作为验证样本

获取scikit-learn框架数据集

load_boston 数据集默认是scikit官方提供的数据集,采用的是dict方式提供,里面包括特征值、目标值、特征名、和详细介绍信息。掌握数据的获取与存取显的非常重要,可能以后数据在服务器就可以采用此方式返回。

创建机器学习模型

创建线性回归的机器学习模型,对模型的训练集进行训练,训练的过程就是获取权重与偏重的过程,例如官方有13个特征值那么训练结果将会有13个权重(lr.coef_)和1个偏置(lr.intercept_)

获取测试集正确率

输出结果发现,正确率非常低,这是因为多元一次方程最后生成的模型只能是一条直线,但是在生产过程中很多变化趋势是曲线,因此我们下节课要采用多项式回归

多项式与过拟合

文章目录

多项式回归介绍Numpy实现多项式一次多项式生成的直线图二次多项式生成的曲线图

多项式回归介绍

直线回归研究的是一个依变量与一个自变量之间的回归问题,但是,在畜禽、水产科学领域的许多实际问题中,影响依变量的自变量往往不止一个,而是多个,比如绵羊的产毛量这一变量同时受到绵羊体重、胸围、体长等多个变量的影响,因此需要进行一个依变量与多个自变量间的回归分析,即多元回归分析。

Numpy实现多项式

一次多项式生成的直线图

二次多项式生成的曲线图

如果想要拟合一个抛物面,而不是拟合一个平面的话,那么就需计算输入变量x二次项的线性组合,则模型更新为下面这个形式

模型可解释性与可视化

文章目录

线性回归可解释性模型特征的可视化房间数与房价正相关散点图空气指标与房价逆相关散点图

线性回归可解释性

可解释性,则说明对于模型的结果我们是可以理解的,我们不但知道正确率,我们还知道正确率怎么来的,在生成环境中我们可能会通过模型的可及时性获取与之相关的特征,这样可以使的我们样本更具有训练意义

模型特征的可视化

房间数与房价正相关散点图

空气指标与房价逆相关散点图

模型保存与加载

文章目录

模型保存与加载机器学习正确率线性回归总结

模型保存与加载

训练好的模型可以先保存起来,下一次可以使用时直接加载即可,这样既节省了时间也提高了效率

机器学习正确率

请注意识别的正确率还得结合具体的场景才显得有意义,例如:人工智能语音识别率已经达到98%,这是还不错,可以用于商用了,但是指纹识别率达到了99%,那这个技术还是不及格,这意味着每100个人的指纹,就有一个出错,那在机场和火车站这样大人流的情况下,根本就没法用。所以正确率必须代入具体的场景才会显得有意义

线性回归总结

没有超参数 只能解决回归问题 (如果要解决分类问题,则可以使用逻辑回归)对数据有假设:数据与输出结果之间有一定的线性关系优点:白盒子算法,对数据具有很强的解释型

标签: #python房价预测用到什么框架