问:
为什么某些机器学习项目需要大量参与者?
A:当您想到机器学习时,您往往会想到在机房键盘上工作的熟练数据科学家。 极端强调定量分析和算法。 这些程序中没有太多直接的现实世界上下文,至少,许多人会这么想。
但是,当今一些最具突破性的机器学习程序正在街上,商店中以及任何他们可以模拟人类基本活动(例如步行,工作或购物)的地方,利用名副其实的人类演员大军。
免费下载: 机器学习及其重要性 |
汤姆·西蒙尼特(Tom Simonite)在《连线》杂志上发表的一篇文章很好地说明了这一点,标题为“使AI变得更聪明,人类可以执行赔付低价任务”。
以在Whole Foods杂货店拍摄的短片为例,Simonite重点介绍了有助于建立下一阶段机器学习阶段的工作。
这就引出了一个问题,为什么所有这些人都通过短而简单的视频来拍摄自己的影片,这些视频记录了像动胳膊或腿一样基本的动作。
答案阐明了机器学习的方向和发展方向。
Simonite写道:“研究人员和企业家希望看到AI在物理世界中理解并采取行动,”他解释了为什么他和其他人正在用相机巡游。 因此,需要工人在超级市场和家庭中表演场景。 他们正在生成教学材料,以教授有关世界和其中的人们的算法。”
正如许多专家会指出的那样,机器学习的一些最大领域涉及图像处理和自然语言处理。 这些都是非常定量的程序–换句话说,没有像“性能良好”的实际环境中那样广泛的输入。 取而代之的是,机器学习程序以非常特定的方式使用视觉和音频数据来构建模型。 通过图像处理,它可以从(有限)视野中拾取特征。 对于NLP,它正在组装音素。
超越这些特定的输入类别,您可能会称其为“图像和语音空白” –超越图像处理和语音识别之类的东西,您将进入计算机必须以不同方式进行分析的领域。 培训集将有根本的不同。
进入摄像师大军。 在其中一些新的机器学习项目中,人类活动的最小想法是训练集。 计算机没有接受训练以寻找构成分类任务的特征,边缘和像素,而是使用训练视频来评估不同类型的动作的外观。
关键是工程师在汇总和加载数据以及对计算机进行了培训之后,将如何处理这些数据。 您很快就会在各个领域看到结果–例如,这将使监视极为有效。 计算机将能够在视野中“看到”人们在做什么,并将其应用于营销和销售等领域,或者在某些情况下还可以应用于政府机构的工作或刑事司法。
这些分歧也为最大利益和隐私问题之间的争论提供了一些启示。 这些视频的大部分使用将建立可用于监视的机器学习模型-但是那些不想被监视的人呢? 当这些新的机器学习程序在公共空间中部署时,个人的权利是什么?界限在哪里?
无论如何,公司都在使用这种人力和视频资源来真正挖掘出下一轮的机器学习进度,这实际上将使计算机能够识别周围发生的事情,而不仅仅是对图像进行分类或使用语音的音素。言语。 这是人工智能领域非常有趣且有争议的发展,值得在技术媒体及其他领域予以关注。
