目录:
定义-测试集是什么意思?
机器学习中的测试集是辅助(或第三级)数据集,用于在初始训练数据集上对机器学习程序进行训练后对其进行测试。 这个想法是,与从编程的角度进行分析相反,预测模型始终具有某种未知能力,需要对其进行测试。
测试集也称为测试数据集或测试数据。
技术百科解释了测试仪
许多专家会说,最佳实践是将测试数据集“隔离”或保留到过程的最后。 工程师在培训过程中会寻找模型的过度拟合和其他问题。 理想情况下,存在第三组验证数据集,用于测试分类器参数。 然后,直到那时,才可以带出测试集,以查看程序的训练水平以及其预测模型在新数据上是否准确。 尽管某些模型可能会完全避免创建分区的测试集,但这通常被认为是短视的,因为缺乏实际的测试可能会使程序易于出现错误。