音讯 什么是未标记数据? -技术百科的定义

什么是未标记数据? -技术百科的定义

目录:

Anonim

定义-未标记数据是什么意思?

未标记数据是未标记有特征,特性或分类的标签的数据的标记。 未标记的数据通常用于各种形式的机器学习中。

Techopedia解释了未标记的数据

在称为无监督机器学习的机器学习类型中,机器学习程序通过评估未标记数据集来运行。 由于数据没有标签,因此机器学习程序必须根据其属性和特征识别每个数据。

解释这一点的最佳方法之一是使用水果盘隐喻。 假设机器学习程序正在学习识别三种不同的水果-香蕉,葡萄和苹果。 如果标记了初始训练集中的数据,则机器学习程序将从该角度进行工作-将连续图像匹配到这三个类别之一。

但是,如果数据中没有一个标有三个水果名称(香蕉,葡萄和苹果),则机器学习程序将需要通过评估每个图像并查看颜色(黄色,红色或紫色),形状等特征来工作。长而细,圆形或成簇–以及其他特征。

从该示例可以很容易地看出,标记数据如何为使用机器学习算法获得决策结果提供了更轻松的机会。 但是,处理未标记数据的复杂的无监督机器学习程序也可以产生惊人的准确结果。

什么是未标记数据? -技术百科的定义