本示例教您如何在Excel中运行线性回归分析以及如何解释“摘要输出”。
您可以在下面找到我们的数据。最大的问题是:售出数量(输出)与价格和广告(输入)之间是否存在关系。换句话说:如果我们知道价格和广告,是否可以预测已售数量?
1.在“数据”选项卡上的“分析”组中,单击“数据分析”。
注意:找不到“数据分析”按钮?单击此处加载Analysis ToolPak加载项。
2.选择回归,然后单击确定。
3.选择Y范围(A1:A8)。这是预测变量(也称为因变量)。
4.选择X范围(B1:C8)。这些是解释变量(也称为自变量)。这些列必须彼此相邻。
5.检查标签。
6.单击“输出范围”框,然后选择单元格A11。
7.检查残差。
8.单击确定。
Excel产生以下汇总输出(四舍五入到小数点后三位)。
R广场
R Square等于0.962,非常适合。价格和广告的自变量解释了售出数量中96%的变化。越接近1,回归线(读入)越适合数据。
重要性F和P值
要检查结果是否可靠(统计显着),请查看显着性F(0.001)。如果该值小于0.05,则可以。如果显着性F大于0.05,则最好停止使用这组自变量。删除具有高P值(大于0.05)的变量,然后重新运行回归,直到显着性F降至0.05以下。
大多数或所有P值应低于0.05。在我们的示例中就是这种情况。(0.000,0.001和0.005)。
系数
回归线是:y =销售数量= 8536.214 -835.722 *价格+ 0.592 *广告。换句话说,每增加单位价格,售出数量就会减少835.722个单位。广告的每增加一个单位,售出数量就会增加0.592个单位。这是有价值的信息。
您也可以使用这些系数进行预测。例如,如果价格等于$ 4,而广告等于$ 3000,则您可能能够实现8536.214 -835.722 * 4 + 0.592 * 3000 = 6970的售出数量。
残差
残差显示实际数据点与预测数据点之间的距离(使用等式)。例如,第一个数据点等于8500。使用等式,预测数据点等于8536.214 -835.722 * 2 + 0.592 * 2800 = 8523.009,得到8500-8523.009 = -23.009的残差。
您还可以创建这些残差的散点图。