eviews回归分析步骤 关于Eviews,你必须知道的20个精彩问答( 二 )


问题6:几个相关系数的含义是什么?
简单相关系数:也叫相关系数或线性相关系数。一般用字母R表示,用来衡量量化变量之间的线性相关性。
复相关系数:也叫多重相关系数。复相关是指因变量与多个自变量之间的相关。比如某一商品的需求与其价格水平和员工收入水平之间存在多重相关性。
偏相关系数:也叫偏相关系数。偏相关系数反映的是一个变量与另一个变量在修正其他变量后的相关性。修正的意义可以理解为假设所有其他变量取平均值。偏相关系数的假设检验相当于偏回归系数的T检验。复相关系数的假设检验相当于回归方程的方差分析。
可确定的系数是相关系数的平方。含义:可确定系数越大,自变量对因变量的解释程度越高,因自变量引起的变化占总变化的百分比越高。密集的观测点在回归线附近。
问题7:7:PCA VS PLS有什么区别?
分量回归是数据的正交旋转变换,变换后的变量都是正交的。(有时候为了去除维度的影响,会先做集中化。).偏最小二乘回归相当于主成分分析和典型相关分析的思想,分别从自变量和因变量中提取成分t和u(偏最小二乘因子),以保证t和u能够尽可能多地提取其变量组的变异信息,同时保证它们之间的最大相关性。偏最小二乘回归相对于主成分回归的优势在于偏最小二乘回归能更好的解决样本数小于变量数的问题,而且除了自变量矩阵,还考虑了响应矩阵。
问题8:面板数据和输入怎么做?
首先要明确做均衡面板数据分析还是非均衡面板数据分析,先介绍前者:
准备平衡面板数据集(如xls.txt文件)
文件/新建/工作文件创建工作文件
选择无结构/无日期以填写时间序列数据(观察值)的数量
选择对象/新对象/池,输入横截面个人的标识
导入数据集
导入数据后,您可以根据需要进行各种面板数据分析
首先,数据在excel表中按企业排序,第一列是企业ID fcode,第二列是时间
11990
11991
11992
21990
21991
……
然后通过对象/新对象/序列在eviews中建立fcode和year序列,导入排序后的数据。在下一步中,双击菜单栏底部的范围,在对话框左侧选择工作文件结构类型为日期面板,在ID系列之后输入fcode,在日期系列之后输入年份,在右侧对话框中保持上部不变,去掉下部的所有钩子,然后单击确定。这将自动生成dateid序列并建立面板数据。其他变量的数据可以按照一般方法输入。
问题9:有什么简单的描述性统计运算方法吗?
点击某个序列,如‘x’,双击弹出。在数据界面-视图-图形中,可以执行绘制操作,如折线图或散点图。图片完成后如何保存?右键-保存图到磁盘…选择保存路径,当然QQ截图是万能的。(调整图形的右键选项还有很多。无论是调整水平轴还是添加文本,都需要先冻结绘图窗口,然后才能操作。
肯定有同学想问,画多个变量怎么样?
你不必双击序列,只需在软件顶部的菜单中选择快速图表,输入需要绘制的变量,然后像单个序列一样操作...
那么你是如何得到均值这样的统计数据的呢?也可以点击你需要知道的序列-查看-删除统计数据&测试,你可以得到均值、标准差、峰度等信息。
问题10:为什么取对数,怎么取对数?
通常在一些数据处理中,往往对原始数据取对数,然后进行进一步处理。其原因是对数函数在其域内是单调递增函数,取对数后数据的相对关系不会改变。取对数的功能主要包括:
减少数据绝对值,方便计算。比如每个数据项的值非常大,很多这样的值的计算可能会超出常用数据类型的取值范围。这时候取对数会降低数值。比如在TF-IDF计算中,大规模语料库中很多词的出现频率非常大。

推荐阅读