音讯 什么是非结构化数据? -技术百科的定义

什么是非结构化数据? -技术百科的定义

目录:

Anonim

定义-非结构化数据是什么意思?

非结构化数据表示任何不具有可识别结构的数据。 它是无组织的,原始的,可以是非文本的或文本的。 例如,电子邮件可以很好地说明非结构化文本数据。 它包括时间,日期,收件人和发件人的详细信息以及主题等,但是电子邮件正文仍然是非结构化的。 非结构化数据也可以标识为松散结构化的数据,其中数据源包括一个结构,但并非数据集中的所有数据都遵循相同的结构。

在以客户为中心的企业中,可以检查以非结构化形式找到的数据,以增强关系营销和客户关系管理(CRM)。 随着诸如Facebook和Twitter之类的社交媒体应用程序成为主流,非结构化数据的开发可能会超过结构化数据的进度。

技术百科解释了非结构化数据

非结构化数据是指遵循某种形式的数据,该形式比电子表格页面,数据库表或其他线性或有序数据集等项目的排序少。 实际上,术语“数据集”很有用,因为它与整洁,可访问的数组中的数据相关联,没有任何额外的内容,并且以特定结构链接或标记了数据。

非结构化文本数据的其他实例包括Word文档,PowerPoint演示文稿,即时消息,协作软件,文档,书籍,社交媒体帖子和病历。 非文本非结构化数据通常在媒体中创建,例如MP3音频文件,JPEG图像和Flash视频文件等。

非结构化数据通常不包含预定义的数据模型,并且可能与关系表不匹配。 非结构化数据通常是大量文本。 但是,它可能包括数字和日期以及事实。 这导致使用常规软件程序难以识别的歧义。

如果管理不善,则存储在企业内部生成的大量非结构化数据可能会导致更高的费用。 必须扫描硬拷贝文档或电子格式的数据,以便搜索应用程序解析想法,具体取决于某些上下文中使用的单词。 这称为企业搜索或语义搜索。

什么是非结构化数据? -技术百科的定义