投稿问答最小化  关闭

万维书刊APP下载

大数据学习手册:定量评估模型

2023/9/28 9:07:03  阅读:67 发布者:

以下文章来源于大数据专家傅一航 ,作者傅一航

欠拟合评估

很容易理解,欠拟合其实就是模型在训练集和测试集上的表现都很差(误差都大)。当你发现在训练集上,模型的质量达不到要求时,都可以认为是欠拟合。

欠拟合解决方法,详细参考后续的回归模型优化章节。

过拟合评估

前面介绍过,当模型在测试集上的误差比较小,而在测试集上的误差比较大时,就说明模型出现了过拟合,也说明模型将训练集中的噪声都学习进去了,造成了模型的泛化能力较差。

过拟合与模型复杂度

数学家们发现,模型之所有过拟合,往往与模型的复杂程度有关。模型越复杂,过拟合的可能性就越高;但模型过于简单,就会导致模型欠拟合,同样也是不可用的。所以,需要在模型的质量和模型复杂度之间找到一个平衡点。

图表209过拟合与模型复杂度

如下所示,在回归模型中,如果模型过于简单(一元线性回归),则出现欠拟合;如果模型过于复杂(4次多项式),则会出现过拟合,所以需要找到一个复杂度合适的回归模型。

图表2010欠拟合与过拟合

那么,怎样才能评估模型是否过拟合呢?

学习曲线

学习曲线(Learning Curve),是常用来检验模型过拟合的方法。

学习曲线,其横坐标为数据量的大小,纵坐标为模型在训练集和测试集上的准确率,如下图所示。

图表2011学习曲线

一个好的模型,在训练集和测试集上的准确率都应该比较高,而且是慢慢接近的。下图中,第一个图中,虽然两条曲线是在慢慢接近,但他们的汇合处的准确率太低,说明是欠拟合;第二个图中,两条曲线虽然在靠近,但并没有汇合,说明出现了过拟合;第三个图,两条曲线在慢慢接近,而且汇合处的准确率比较高,说明模型刚刚好。

图表2012常见的学习曲线

验证曲线

验证曲线(Validation Curve),绘制的是模型准确率与模型超参取值之间的关系。

图表2013验证曲线

从验证曲线,可以看到随着超级参数的改变,模型可能从欠拟合到合适,再从合适到过拟合的过程,因此可以帮助我们选择一个合适的超参,来提高模型的性能。

过拟合解决方法,详细参考后续的回归模型优化章节。

两模型差异比较

模型评估效果

关于模型的评估,我们还经常用偏差和方差两个概念来表示。

偏差

偏差(Bias),指的是模型是否准确,即误差的集中程度。在交叉验证中,相当于K个模型质量的平均值。

方差

方差(Variance),指的是模型是否稳定,即误差的离散程度。在交叉验证中,相当于K个模型质量的方差。

如下图所示,一个好的可用的模型,肯定是低偏差和低方差的,但很多场景下两者往往不可兼得。

一般情况下,参数学习模型(比如线性回归模型),通常是高偏差的,因为对数据有极强的假设(比如要求数据呈正态分布),而非参数学习模型(比如KNN,决策树),通常是高方差的,因为不对数据进行任何的假设,而高度依赖于样本数据。

转自:“量化研究方法”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com