实验33 基于Logistic模型的上市公司信用风险分析

一、实验目的

通过实验室的模拟教学，使学生通过情景模拟和实际操作达到以下目的：

1、掌握分析上市公司财务报表的能力

2、应用Logistic模型判别模型对信用风险进行分析。通过实验室的模拟教学使学生建立雄厚的理论基础同时又锻炼出很强的社会实践能力。

二、准备知识

2.1Logistic模型

Logistic模型介绍

假设有一个理论上存在的连续反应变量代表事件发生的可能性，其值域为负无穷至正无穷。当该变量的值跨越一个临界点c比如c=0）便导致事件发生，于是有：

当 >0 时， =1

在其他情况下， =0

这里，是实际观察到的反应变量，表示事件发生，表示事件未发生

如果假设在反应变量和自变量之间存在一种线性关系，即

$$y_{i}^{*}=\alpha+\beta x_{i}+\varepsilon_{i}$$

有$\begin{array}{c}P\left(y_{i}=1 \mid x_{i}\right)=P\left[\left(\alpha+\beta x_{i}+\varepsilon_{i}\right)>0\right]=P\left[\varepsilon_{i}>\left(-\alpha-\beta x_{i}\right)\right] \\=P\left[\varepsilon_{i} \leq\left(\alpha+\beta x_{i}\right)\right]=F\left(\alpha+\beta x_{i}\right)\end{array}$

$F\left(\alpha+\beta x_{i}\right)$的累积分布函数

由$P\left(y_{i}=1 \mid x_{i}\right)=F\left(\alpha+\beta x_{i}\right)$可知，分布函数的形式依赖于的假设分布。如果为Logistic分布，就得到Logistic回归模型。

$\varepsilon_{i}$的Logistic分布函数形式为$\frac{1}{1+e^{-\varepsilon_{t}}}$

$\varepsilon_{i}$的Logistic分布函数为$P_{i}=F\left(\alpha+\beta x_{i}\right)=\frac{1}{1+e^{-\left(\alpha+\beta x_{i}\right)}}$

其实这就是当$\varepsilon_{i}$取值为$\left(\alpha+\beta x_{i}\right)$时的累积分布函数。在这里，被定义为一系列影响事件发生概率的因素的线性函数，即$\varepsilon_{i}=\alpha+\beta x_{i}$

1、当$\varepsilon_{i}$趋近于负无穷，有$P\left(y_{i}=1 \mid x_{i}\right)=0$

当$\varepsilon_{i}$趋近于正无穷，有$P\left(y_{i}=1 \mid x_{i}\right)=1$

2、当$\varepsilon_{i}$趋近于正无穷或负无穷，函数值变化缓慢，在中间阶段，函数值变化较快

将事件发生概率标注为$P\left(y_{i} \mid x_{i}\right)=p_{i}$

可以得到下列logistic回归模型$p_{i}=\frac{1}{1+e^{-\left(\alpha+\beta x_{i}\right)}}=\frac{e^{\left(\alpha+\beta x_{i}\right)}}{1+e^{\left(\alpha+\beta x_{i}\right)}}$

则事件不发生的概率为$1-p_{i}=1-\left(\frac{1}{1+e^{-\left(\alpha+\beta x_{i}\right)}}\right)=\frac{1}{1+e^{\left(\alpha+\beta x_{i}\right)}}$

则事件发生与事件不发生的概率之比为$\frac{P_{i}}{1-P_{i}}=e^{\left(\alpha+\beta x_{i}\right)}$

两边取对数有$\ln \frac{P_{i}}{1-P_{i}}=\alpha+\beta x_{i}$

这便是logistic回归模型

三、实验软件环境

Excel； Eviews6.0

四、实验内容

1、制作各条件属性散点图，分析经济数据的现实分布特征；

1）选取需要做散点图的条件属下变量

2）利用Eviews，根据条件属性取值大小进行排序

3）利用Eviews制作条件属性散点图，观察现实经济数据的分布情况，体会采用logistic模型而非线性模型的优点

2、制作各条件属性直方图，理解组距大小对数据简化的重要性；

1）选取需要制作直方图的条件属性变量

2）根据条件属性取值大小进行排序

3）选择一个比较大的组距，利用Excel制作直方图，然后选择一个比较小的组距，制作直方图，理解组距大小对直方图的影响以及如何选择适合的组距来体现条件属性所蕴涵的经济学含义

3、对样本数据进行描述性统计分析；

利用Excel中的统计工具箱分析条件属性的均值、方差、相关系数、变异系数，体会采用logistic模型而非线性模型的优点

4、构建Logistic判别模型，对信用风险进行度量；

1）将所收集的样本分为建模样本和检验样本

2）将建模样本中的数据代入模型$\ln \frac{P_{i}}{1-P_{i}}=\alpha+\beta x_{i}+\mathrm{L}+\delta x_{n}$中，然后利用Excel中的回归分析工具拟合方程

3）将建模样本集中每个样本的条件属性值代入拟合好的方程中，求出每个样本$P_{i}$的值

4）结合上市公司在现实经济中的风险状况和$P_{i}$值，求出能区分破产上市公司与非破产上市公司的临界值$P_{i}^{*}$

5）将检验样本集中每个样本的条件属性的数值代入到拟合好的方程中，求出相应的$P_{i}$值，结合临界值$P_{i}^{*}$对检验样本中的信用状况做出评估，然后对照模型对样本所做的风险评估与上市公司现实风险状况，从而判断模型的识别精度

5、结合描述性统计分析的结果分析Logistic判别模型的经济学含义。

五、实验具体步骤：

利用Logistic构建上市公司信用识别模型，模型结构为：$$Y=\ln \frac{P}{1-P}=\alpha+\beta_{1} x_{1}+\beta_{2} x_{2}+\beta_{3} x_{3}+\beta_{4} x_{4}+\beta_{5} x_{5}$$

其中P为上市公司未破产的概率，$x_{1}$为运营资本/总资产，$x_{2}$为留存赢余/总资产，$x_{3}$为税前收益/总资产，$x_{4}$为账面价值/总负债，$x_{5}$为销售额/总资产。

在进行实验之前，通过Eviews构建工作文件夹，（点击file—new—workfile,建立工作文件夹，工作文件夹命名为logist），将Y值与5个条件属性值输入Eviews，分别命名为Y、$x_{1}$、$x_{2}$、$x_{3}$、$x_{4}$、$x_{5}$（点击Quick—empty group，输入6个变量以及6个变量数据）

5.1制作各条件属性散点图，分析经济数据的现实分布特征；

1）任意选取一个条件属性，例如$x_{1}$

2）利用Eviews，根据条件属性$x_{1}$的取值大小进行排序

处理流程：对$x_{1}$进行排序（点击sort,在对话框中选择变量$x_{1}$，点击ok）

3）利用Eviews制作条件属性散点图，观察现实经济数据的分布情况，体会采用logistic模型而非线性模型的优点

处理流程：设立一个新的变量$x_{11}$，（点击Quick—empty group，输入变量名$x_{11}$，同时通过复制粘贴方式将$x_{1}$所对应的数据输入到$x_{11}$中），去除异常值，然后做的散点图5.1

5.2 利用Excel制作各条件属性直方图，理解组距大小对数据简化的重要性；

1）选取需要制作直方图的条件属性变量，例如$x_{1}$

2）根据条件属性取值大小进行排序

3）根据Y的取值，将样本Y＝1的视为一组，将样本Y＝0的视为一组。分别做这两组的直方图。

处理流程：点击“工具”――“数据分析”，在对话框中选择“直方图”，点击确定，然后在对话框中，“输入区域”选择Y＝1的所有样本$x_{1}$的的值，将“接受区域”的空间确定为[-0.05,0.5],组距为0.05，选择“图表输出”，点击确定。得到的图形如图5.2所示

点击“工具”――“数据分析”，在对话框中选择“直方图”，点击确定，然后在对话框中，“输入区域”选择Y＝1的所有样本的的值，将“接受区域”的空间确定为[0,0.6],组距为0.1，选择“图表输出”，点击确定。得到的图形如图5.3所示

5.3 对样本数据进行描述性统计分析；

利用Eviews中的分析条件属性的均值、方差、相关系数、变异系数.

处理流程：点击view—descriptive statistics—histogram and stats

5.4构建Logistic判别模型，对信用风险进行度量；

1）将所收集的样本分为建模样本和检验样本,其中建模样本100个，检验样本60个

2）利用Eviews拟合建模样本的数据，模型结构如下$$M=\ln \frac{P}{1-P}=\alpha+\beta_{1} N_{1}+\beta_{2} N_{2}+\beta_{3} N_{3}+\beta_{4} N_{4}+\beta_{5} N_{5}$$

首先设立新的参数M、$N_{1}$、$N_{2}$、$N_{3}$、$N_{4}$、$N_{5}$.其中P为上市公司未破产的概率，$N_{1}$为运营资本/总资产，$N_{2}$为留存赢余/总资产，$N_{3}$为税前收益/总资产，$N_{4}$为账面价值/总负债，$N_{5}$为销售额/总资产。

在拟合数据之前，通过Eviews构建工作文件夹，（点击file—new—workfile,建立工作文件夹，工作文件夹命名为logistic），将M值与5个条件属性值输入Eviews，分别命名为M、$N_{1}$、$N_{2}$、$N_{3}$、$N_{4}$、$N_{5}$（点击Quick—empty group，输入6个变量以及6个变量数据）

然后点击object—new objiect,在对话框中选择“Equation”，并命名为“jianmo”,点击ok，在“Equation estimation”中输入模型结构“M C $N_{1}$ $N_{2}$ $N_{3}$ $N_{4}$ $N_{5}$”,采用最小二乘法进行估计，估计结果如下

Dependent Variable: M
Method: Least Squares
Date: 04/20/09 Time: 03:04
Sample: 1 100
Included observations: 100


Variable	Coefficient	Std. Error	t-Statistic	Prob.


C	-0.039230	0.059607	-0.658152	0.5120
N1	0.034024	0.171892	0.197937	0.8435
N2	-0.092467	0.147462	-0.627057	0.5321
N3	0.101801	0.175263	0.580847	0.5627
N4	0.174617	0.031697	5.508990	0.0000
N5	0.446610	0.064893	6.882296	0.0000


R-squared	0.581116	Mean dependent var		0.490000
Adjusted R-squared	0.558835	S.D. dependent var		0.502418
S.E. of regression	0.333708	Akaike info criterion		0.701022
Sum squared resid	10.46792	Schwarz criterion		0.857332
Log likelihood	-29.05110	Hannan-Quinn criter.		0.764283
F-statistic	26.08114	Durbin-Watson stat		1.275115
Prob(F-statistic)	0.000000

3）将建模样本集中每个样本的条件属性值代入拟合好的方程中，求出每个样本的值

4）结合上市公司在现实经济中的风险状况和$P_{i}$值，求出能以最小误判率区分破产上市公司与非破产上市公司的临界值$P_{i}^{*}$

操作流程：在excel表格中，将建模样本的条件属性值代入的拟合的识别模型中，得到每一个样本所对应的P_*,然后对P_*进行排序，结合上市公司在现实经济中的风险状况，选取具有最小误判率的P_*作为判别上市公司是否破产的临界值