问:
有监督,无监督和半监督学习有什么区别?
A:机器学习中有监督学习和无监督学习之间的关键区别是训练数据的使用。
监督学习利用示例数据来显示“正确”数据的外观。 数据的结构可显示给定输入的输出。
一种将水果分类的机器学习算法可能将诸如苹果,香蕉,葡萄和橙子等水果的图片作为输入,并将这些水果的名称作为输出。
一个真实的例子是电子邮件程序中的贝叶斯垃圾邮件过滤器。 这些过滤器以被视为垃圾邮件的电子邮件示例进行了培训。 然后,垃圾邮件过滤器可以搜索出现在垃圾邮件中的电子邮件中的某些短语,并将其移动到垃圾邮件文件夹中。
这就像向人们展示如何执行新任务。 可能会以公司想要的格式向某人显示数据输入人员的数据示例,然后期望他们遵循该格式。
使用监督学习的机器学习程序会对训练数据进行多次迭代。 当它真正开始时,结果会令人印象深刻。 Google的Gmail垃圾邮件过滤器非常准确,因为有太多用户对其进行了培训。
无监督学习没有任何先前的培训数据。 在我们的水果分类示例中,可能只向算法显示水果图片并告诉您对其进行分类。
无监督学习通过学习客户的购买习惯在市场研究中应用,或者通过监视黑客模式在市场研究中得到应用。
半监督学习尝试通过标记一些数据来取得中间立场。 例如,苹果和橙子可能会在水果分类程序中标记出来,而香蕉和葡萄则没有。
何时使用这些算法中的任何一种都将取决于所使用的数据类型。 有些任务具有稳定的模式,例如信用卡欺诈或垃圾邮件。 监督学习适合于此类任务。 网络攻击是不可预测的,因此,无监督或半监督的学习方法可能更合适。