一、实验目的
通过上机实验,使学生加深对时间序列平稳性的理解,掌握如何利用自相关系数和偏自相关系数对ARIMA模型进行识别,利用最小二乘法等方法对ARIMA模型进行估计,利用信息准则对估计的ARIMA模型进行诊断,以及如何利用ARIMA模型进行预测。掌握在实证研究如何运用Eviews软件进行ARIMA模型的识别、诊断、估计和预测。
二、预备知识
(1)用EViews估计线性回归模型的基本操作;
(2)时间序列数据平稳性及其检验方法;
(3)了解ARMA模型的结构及估计方法。理解ARMA模型三种基本形式:自回归模型(AR),移动平均模型(MA)和混合模型(ARMA),能够运用Eviews 软件检验时间序列数据的平稳性和估计ARMA模型。
三、实验内容
(1)用EViews计算时间序列数据的样本自相关系数和QLB统计量;
(2)用EViews对时间序列进行单位根检验;
(2)估计时间序列的ARMA模型,进行参数检验分析与预测。
四、实验步骤
ARIMA模型全称为自回归移动平均模型(Autoregressive Integrated Moving Average Model,简记ARIMA),是由博克思(Box)和詹金斯(Jenkins)于70年代初提出的一著名时间序列预测方法,所以又称为box-jenkins法。其中ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归, p为自回归项;MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。ARIMA模型的基本思想是:将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。
建立ARIMA模型的基本步骤如下:首先根据时间序列的散点图、自相关函数和偏自相关函数图以ADF单位根检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。其次,根据时间序列模型的识别规则,建立相应的模型,若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合ARMA模型,进行参数估计,检验是否具有统计意义。最后是进行假设检验,诊断残差序列是否为白噪声,并可利用已通过检验的模型进行预测分析。
4.1建立工作文件及导入数据
点击 File/New/Workfile建立工作文件,并输入数据或者导入数据。数据范围为2006年1月4日到2009年3月10日人民币兑美元汇率中间价日数据,共计773个样本数据,考虑到2008年7月18日以后,人民币兑美元汇率相对稳定,因此本文把样本范围确定为2006年1月4日——2008年7月17日,共计618个数据。
4.2 显示汇率数据的时间路径图
从工作文件窗口菜单选择选择Quick/Graph/ Line Graph(如图4.1),给出人民币兑美元汇率中间价日数据序列及其差分序列的曲线特征图(如图4.3、4.4)。
双击图形区域中任意处或在图形窗口中点击Procs/Options,则会弹出如图2所示的Graph Options窗口,进入图形编辑状态。选择图形类型、图形属性(是否置入图框内,刻度,是否用彩色)、柱和线的选项,设定竖轴(单个,双个,是否交叉),设定比例尺度(优化线性尺度,强制通过0线,对数尺度,正态化尺度),手动设定比例尺度、线形图选项、柱形图选项、散点图选项(连接,配拟合直线)、饼图选项等。
通过观察,人民币兑美元汇率中间价日数据二阶差分序列的极差大于一阶差分序列,因此可以认为对人民币兑美元汇率中间价日数据取一阶差分进行分析就可以了,如果求二阶差分进行分析则属于过度差分。
从工作文件窗口菜单选择Quick/Series Statistics/Histogram and Stats(如图4.6),则会显示人民币兑美元汇率中间价日数据序列及其差分序列的描述统计量(图4.7,4.8),如均值、方差、偏度、峰度、J-B 统计量(用于正态性检验)等。根据图6、图7的检验结果,观察JB统计量的值,可以看出P值接近0,表明至少可在99.99%的置信水平下拒绝零假设(H0:序列服从正态分布;H1:序列不服从正态分布),即人民币兑美元汇率中间价日数据序列及其差分序列不服从正态分布。
(三)计算汇率日数据的样本自相关系数和QLB统计量
从序列窗口菜单选择Quick/Series Statistics/ Correlogram,给出组中序列的水平序列及其差分序列的自相关函数和偏自相关函数,在Correlogram Specification窗口,设定样本自相关系数的最大滞后期为20,见图,按OK后,最后结果如图所示。AC为样本自相关系数,Q-Stat即为QLB统计量,Autocorrelation是样本自相关系数图。可见,无论是样本自相关图还是QLB统计量,均显示EXCHANGE序列是非平稳序列,D(EXCHANGE)序列是平稳序列,D(EXCHANGE,2)序列属于过度差分,显示不平稳特征。
(四)对汇率日数据序列进行单位根检验
出现Unit Root Test窗口后,在Test Type框中,选择检验类型是Augmented Dickey-Fuller检验。在Test for unit root in框中,选择level,表示是对GDP序列进行检验,如果要对GDP序列的一阶差分或二阶差分进行检验,则选1st difference或2st defference。在Include in test equation框中,选择Intercept,表示检验方程包含截距项,选择Trend and intercept,表示检验方程同时包含时间趋势和截距项,选择None,表示检验方程不包含截距项和时间趋势,在Lagged difference,可以设定检验方程包含的差分序列的滞后期,具体设定见图。分别对人民币兑美元汇率日数据序列及其一阶差分序列进行单位根检验,每一个序列都分别选择了三种方程形式,下面是部分模拟结果,从中可以判断, EXCHANGE序列是非平稳序列,而D(EXCHANGE)序列则可以认定为平稳序列。
(五)估计汇率序列的ARMA模型
作普通最小二乘法估计:在主菜单选 Quick \Estimate Equations,进入输入估计方程对话框, 输入待估计方程,选择估计方法—普通最小二乘法,如图4.1-4.8所示。点击 OK 进 行估计,得到估计方程(1)及其统计检验结果,如图4.1-4.9所示。应用Box-Jenkins(BJ)方法论时,要注意的一个重要的问题是,我们必须有一平稳的时间序列,或者是经过一次或多次差分而变为平稳的时间序列。假定平稳性的原因,可解释如下:BJ(博克思-詹金斯)的目的,是要辨别并估计一个可解释为产生现有样本数据的统计模型,如果现在要把所估计的模型用于预测,我们必须假定该模型的特征在不同时期里特别是在将来的时期里保持不变。因此,要求有平稳数据的简单理由是,从这些数据推测出来的任何模型本身就可解释为平稳的或稳定的,从而为预测奠定有效的基础。因此,根据前面的分析D(EXCHANGE)序列可以认定为平稳序列。下面根据人民币兑美元汇率日数据一阶差分序列的自相关函数图及偏自相关函数图进行ARMA模型拟合,进过反复试验,得到EXCHANGE的两个模型ARIMA(2,1,0),ARIMA(0,1,2),能够较好的拟合样本数据。
观察图4.9可见人民币兑美元汇率日数据序列的自相关函数呈线性缓慢衰减特征,偏相关图在k=1时出现峰值呈截尾特征,因此选择AR(1)模型来拟合,模拟结果见图4.16,4.17。可以看出,模型特征方程根的倒数为1 ,即特征根为1 ,所以人民币兑美元汇率日数据序列是非平稳过程,这正好映正了上面相关图的分析,为了得到稳定的模型,我们采用人民币兑美元汇率日数据一阶差分序列进行分析。
人民币兑美元汇率日数据一阶差分序列D(EXCHANGE)的相关图、偏向关图由图10给出,从中可以看出,D(EXCHANGE)的相关图在k=2时出现峰值呈近似截尾或衰减特征,偏相关图也在k=2时出现峰值呈近似截尾或衰减特征,说明LAGRI是一个平稳序列。经过反复试验,发现用用AR(2),MA(2)拟合较好。下面是拟合结果,AR(2)拟合模型结果见图18-20,MA(2)拟合模型见图21-23。
拟合结果一:
人民币兑美元汇率日数据一阶差分序列D(EXCHANGE)的带漂移项的AR(2)模型通过了检验,方程为:
ΔEXCHANGE (t)= -0.00203-0.07101*[ΔEXCHANGE (t-1)+0.00203]+u(t)
(-7.443) (-1.759)
R2 = 0.005, Q0.05 (k–p–q) = Q0.05 (15-2-0) = 22.4(Q值见Box-Pierce 计算)
根据伯克斯—皮尔斯(Box-Pierce)检验,选择样本容量T=15,对AR(2), 模型自回归部分的最大滞后值p=2,移动平均部分的最大滞后值q=0。选择α=0.05,查表得χ²(0.05)=22.4。残差序列的随机性检验结果Q=19.96<χ²(0.05),可以认为该估计残差序列是白噪声过程,所以用模型AR(2)估计D(EXCHANGE)是合适的。
拟合结果二:
人民币兑美元汇率日数据一阶差分序列D(EXCHANGE)的带漂移项MA(2)模型通过了检验,方程为:
ΔEXCHANGE (t)= -0.00203-0.08019*[ u (t-2)+0.00203]+u(t)
(-7.573) (-1.990)
R2 = 0.006, Q0.05 (k–p–q) = Q0.05 (15-2-0) = 22.4(Q值见Box-Pierce 计算)
根据伯克斯—皮尔斯(Box-Pierce)检验,选择样本容量T=15,对MA(2), 模型自回归部分的最大滞后值p=2,移动平均部分的最大滞后值q=0。选择α=0.05,查表得χ²(0.05)=22.4。残差序列的随机性检验结果Q=19.79<χ²(0.05),可以认为该估计残差序列是白噪声过程,所以用模型MA(2)估计D(EXCHANGE)是合适的。
五、补充练习
运用ARMA模型,模拟我国上证综合指数日收盘指数数据(时间:1997年1月4日至2003年12月31日)的变化规律。
附录:ARIMA过程与其自相关函数偏自相关函数特征
模 型 | 自相关函数特征 | 偏自相关函数特征 |
ARIMA(1,1,1) Δ xt = ϕ1Δ xt-1 + ut + θ1ut-1 | 缓慢地线性衰减 | |
AR(1) xt = ϕ1 xt-1 + ut | 若ϕ1 > 0,平滑地指数衰减 若ϕ1 < 0,正负交替地指数衰减 | 若ϕ11 > 0,k=1时有正峰值然后截尾 若ϕ11 < 0,k=1时有负峰值然后截尾 |
MA(1) xt = ut + θ1 ut-1 | 若θ1 > 0,k=1时有正峰值然后截尾 若θ1 < 0,k=1时有负峰值然后截尾 | 若θ1 > 0,交替式指数衰减 若θ1 < 0,负的平滑式指数衰减 |
AR(2) xt = ϕ1 xt-1 + ϕ2 xt-2 + ut | 指数或正弦衰减 (两个特征根为实根) (两个特征根为共轭复根) | k=1, 2时有两个峰值然后截尾 (ϕ1 > 0,ϕ2 > 0) (ϕ1 > 0,ϕ2 < 0) |
MA(2) xt = ut + θ1 ut-1+ θ2 ut-2 | k=1, 2有两个峰值然后截尾 (θ1 > 0,θ2 < 0) (θ1 > 0,θ2 > 0) | 指数或正弦衰减 (θ1 > 0,θ2 < 0) (θ1 > 0,θ2 > 0) |
ARMA(1,1) xt = ϕ1 xt-1 + ut + θ1 ut-1 | k=1有峰值然后按指数衰减 (ϕ1 > 0,θ1 > 0) (ϕ1 > 0,θ1 < 0) | k=1有峰值然后按指数衰减 (ϕ1 > 0,θ1 > 0) (ϕ1 > 0,θ1 < 0) |
ARMA(2,1) xt = ϕ1 xt-1+ ϕ2 xt-2+ ut + θ1 ut-1 | k=1有峰值然后按指数或正弦衰减 (ϕ1 > 0,ϕ2 < 0,θ1 > 0) | k=1, 2有两个峰值然后按指数衰减 (ϕ1 > 0,ϕ2 < 0,θ1 > 0) |
ARMA(1,2) xt = ϕ1 xt-1+ ut + θ1 ut-1+ θ2 ut-2 | k=1, 2有两个峰值然后按指数衰减 (ϕ1 > 0,θ1 > 0,θ2 < 0) (ϕ1 > 0,θ1 > 0,θ2 >0) | k=1有峰值然后按指数或正弦衰减 (ϕ1 > 0,θ1 > 0,θ2 < 0) (ϕ1 > 0,θ1 > 0,θ2 > 0) |
ARMA(2,2) xt=ϕ1xt-1+ϕ2xt-2+ ut +θ1ut-1+θ2ut-2 | k=1, 2有两个峰值然后按指数或正弦衰减 (ϕ1 > 0,ϕ2 < 0,θ1 > 0,θ2 < 0) (ϕ1 > 0,ϕ2 < 0,θ1 > 0,θ2 > 0) | k=1, 2有两个峰值然后按指数或正弦衰减 (ϕ1 > 0,ϕ2 < 0,θ1 > 0,θ2 < 0) (ϕ1 > 0,ϕ2 < 0,θ1 > 0,θ2 > 0) |
发表回复