资料库 什么是数据库中的知识发现(kdd)? -技术百科的定义

什么是数据库中的知识发现(kdd)? -技术百科的定义

目录:

Anonim

定义-数据库知识发现(KDD)是什么意思?

数据库中的知识发现(KDD)是从数据集合中发现有用知识的过程。 这种广泛使用的数据挖掘技术是一个过程,包括数据准备和选择,数据清理,合并有关数据集的先验知识以及根据观察到的结果解释准确的解决方案。

KDD的主要应用领域包括市场营销,欺诈检测,电信和制造。

Techopedia解释了数据库中的知识发现(KDD)

传统上,数据挖掘和知识发现是手动执行的。 随着时间的流逝,许多系统中的数据量增长到超过TB的大小,无法再手动维护。 此外,对于任何企业的成功存在而言,发现数据中的潜在模式也至关重要。 结果,开发了几种软件工具来发现隐藏数据并进行假设,这构成了人工智能的一部分。

KDD流程已在过去10年达到顶峰。 它现在包含许多不同的发现方法,包括归纳学习,贝叶斯统计,语义查询优化,专家系统的知识获取和信息论。 最终目标是从底层数据中提取高层知识。

KDD包括多学科活动。 这包括数据存储和访问,将算法缩放到海量数据集和解释结果。 数据仓库中包含的数据清理和数据访问过程有助于KDD过程。 人工智能还通过从实验和观察中发现经验定律来支持KDD。 数据中识别出的模式必须对新数据有效,并且具有一定程度的确定性。 这些模式被认为是新知识。 整个KDD流程涉及的步骤为:

  1. 从客户的角度确定KDD流程的目标。
  2. 了解涉及的应用程序域和所需的知识
  3. 选择要在其上执行发现的目标数据集或数据样本的子集。
  4. 通过决定处理缺失字段并根据要求更改数据的策略来清理和预处理数据。
  5. 通过删除不需要的变量来简化数据集。 然后,根据目标或任务,分析可用于表示数据的有用功能。
  6. 将KDD目标与数据挖掘方法匹配,以建议隐藏的模式。
  7. 选择数据挖掘算法以发现隐藏的模式。 该过程包括确定哪些模型和参数可能适用于整个KDD过程。
  8. 以特定的表示形式搜索感兴趣的模式,包括分类规则或树,回归和聚类。
  9. 从挖掘的模式中解释基本知识。
  10. 使用知识并将其合并到另一个系统中以采取进一步的措施。
  11. 记录下来并为有兴趣的各方提供报告。
什么是数据库中的知识发现(kdd)? -技术百科的定义