过拟合

1. 重新划分数据集

其中60%作为训练集20%作为交叉验证集(cross validation),20%作为测试集

数据集划分为三类

2. 可以计算出三类数据的误差函数

三种误差函数

3. 使用交叉验证集选择模型

选出交叉验证误差最小的一个模型

交叉验证集选模型

4. 利用测试集计算出推广误差