音讯 什么是文本数据挖掘? -技术百科的定义

什么是文本数据挖掘? -技术百科的定义

目录:

Anonim

定义-文本数据挖掘是什么意思?

文本数据挖掘涉及梳理文本文档或资源以获得有价值的结构化信息。 这就需要复杂的分析工具来处理文本,以便从相对原始或非结构化的格式中收集特定的关键字或关键数据点。

文本数据挖掘也称为文本挖掘或文本分析。

Techopedia解释了文本数据挖掘

在文本数据挖掘中,工程系统使用分类法和词法分析之类的东西来确定文本文档的哪些部分作为挖掘数据有价值。 统计模型通常是有用的,并且系统也可以使用试探法或算法猜测法来尝试确定文本的哪些部分很重要。 其他控制系统包括标记和关键字分析,其中工具会查找特定的专有名词或其他标签和关键字以弄清楚正在写的内容。

文本挖掘的另一个独特组成部分通常称为情感分析。 在情感分析中,这通常比统计分析要困难得多,分析工具试图在非常主观和直观的层面上弄清书面文本及其所要解决的其他方面的情绪或情感。 随着人工智能工具的出现,情感分析已取得了很大进步,例如,现代文本数据挖掘不仅仅是收集定量参考,还涉及将高级概念模型引入文本挖掘以找出新的独特方法汇总有价值的数据。

什么是文本数据挖掘? -技术百科的定义