龙空技术网

某省人口预测

任源 237

前言:

眼前小伙伴们对“用一元线性回归分析法预测该地区”都比较关心,各位老铁们都需要学习一些“用一元线性回归分析法预测该地区”的相关文章。那么小编也在网摘上收集了一些对于“用一元线性回归分析法预测该地区””的相关知识,希望同学们能喜欢,你们一起来了解一下吧!

人口是土地利用中最活跃的因素,了解人口预测的方法和预测人口对我们土地利用规划具有重要意义。利用人口数据进行合理分析,得出人口的自回归方程和灰色预测模型,并预测2030年该省的人口。本文分为四个部分,第一部分是技术路线,第二部分是散点图和时间序列自相关、时间序列自回归分析,第三部分主要是回归分析,包括一元线性回归曲线回归,在曲线回归里面,我选择对数回归和S形曲线。第四部分是灰色预测模型,第五部分是误差分析,第五部分为主要结论。

关键词:人口预测,时间序列,回归分析,灰色预测模型

一、导论

利用时间序列和预测分析来预测某省的2030年人口,主要利用Excel来做数据预处理和时间序列自回归分析和灰色预测模型,SPSS绘制散点图和时间序列自相关分析,还有一元线性回归和曲线回归,Python来进行2030年人口预测。

二、散点图和时间序列自相关

在散点图中,我们可以看出该省的人口大体是下降的,人口大体在3500万至3900万之间。

接下来对该省的人口数据进行时间序列自相关分析。

延迟一次的数字相关系数为0.907,说明该数据有明显的自相关,这个很好理解,今年的人口肯定和去年的人口相关。由自相关和偏自相关的图可知:自相关是拖尾,偏相关是截尾,我们一般用AR算法。

在Excel里面对数据进行时间序列自回归分析,先对数据进行预处理,这里我计算一阶AR算法(简称AR1,以下如上,都用简称),AR2,AR3和MR1。

N阶AR模型公式:

移动平均MR公式:

(一)AR1

AR1自回归方程:

(二)AR2

AR2自回归方程:

(三)AR3

AR3自回归方程:

(四)MR1

MR1公式:

经过R²,标准误差,调整后的R,残差等对比,认为AR3的拟合优度最好,所以选用AR3的模型:

AR3预测值与观测值对比

在Pycharm中利用2016,2017,2018三年的观测值作为基期,预测2030年该省的人口

AR3模型预测的2030年人口为:3573.3157万人

注:其余模型的具体的情况和2030年其他模型的人口数值,我就不在这里详细说明,详情看一看哪个时间序列.xlsx。

三、回归分析

(一)一元线性回归

其实从散点图来看,一元线性回归和散点图的差距还是有点大,还是在Jupyter Notebook中用Python来验证一下。

从图中知道,R=-0.773,R方= 0.597529,这个呈现负相关,而且相关系数不是很高。求得回归方程:

2030年预测人口为:3225.00089474万人。

(二)S形曲线

S形曲线方程:

在SPSS中进行曲线拟合。

相比之下:S曲线的拟合优度是0.598,比那个一元线性回归要好一点,但是都是差不多的

求得S形曲线回归方程:

2030年预测人口为:3250.9401万人。

(三)对数回归

对数曲线:

在SPSS中看结果

同样,看这个R方是0.598,不太高。

回归方程:

在Python中算出,2030年对数回归预测为:3227.2467万人。

四、灰色预测模型

目前使用最广泛的灰色预测模型就是关于数列预测的一个变量、一阶微分的GM(1,1)模型。它是基于随机的原始时间序列,经过按时间累加后所形成的新的时间序列呈现的规律可用一阶线性微分方程的解来逼近。经证明,经一阶线性微分方程的解逼近所揭示的原始时间序列呈指数变化规律。因此,当原始时间序列隐含着指数变化规律时,灰色模型GM(1,1)的预测是非常成功的。所以,我这里灰色预测模型使用一个变量,一阶微分的GM(1,1)模型,主要利用Python和Excel进行灰色模型预测。

首先对进行一次累加

生成一次累加序列:

GM(1,1)模型:

GM(1,1):

通过图和表可知,GM(1,1)模型2030年的人口数:

五、误差分析

首先是数据,这个数据还是少了一点,我们希望数据可靠和有效。人口增长受到很多因素的影响,一些重大的疾病或者战争都会使人口锐减,比如现在的疫情爆发,这些突发的重大因素都对我们人口预测产生很多不确定性。还有就是自己在计算的时候可能有些误差,对数据的处理不到位。

六、主要结论

AR1、AR2还有MR1,他们与AR3的算法类似,而且AR3更优一点,所以就没有计算这三个值。在这些方法中,AR3所预测出来的人口最多为:3573.3157万人,GM(1,1)所预测的人口最少为:3222.002万人。三种回归分析,一元线性回归分析,S形曲线和对数曲线,从散点图和这三种的R方来看,三种的R方都没有超过0.6,所以不太合适。这个人口应该是自相关的,就是今年的人口受到去年的人口影响较大,而不是与年份相关。

GM(1,1)灰色预测模型出来的偏小,这个可能是该省的人口大概呈现下降的趋势。一种观点认为,我们国家现在已经面临人口老龄化问题,进入一种未富先老的境地。国家会鼓励生育,比如放开二胎等,这些措施使得我国的生育率有所提升。但是另外一种观点认为,高房价,生活压力就是最好的避孕药,人们现在普遍不敢生育了。这个也得到了验证,二胎政策放开以后,那个生育率并不像人们预测的那样,生育率会猛涨。当今我国已经进入了“三低”时代(低出生率、低死亡率、低自然增长率),为了缓解人口老龄化,国家会出台更多的政策,但是这个社会潮流不可逆,我国的人口会下降的。具体到该省,10年后(今年是2020年),人口应该会略有下降,但是由于鼓励生育的政策,不会下降得太严重。

最后说明:我认为AR3的算法比较合理,10年后该省人口大概在3500万左右。

注:原创,希望给大家在预测人口的时候有一点点启发。

标签: #用一元线性回归分析法预测该地区