发展历程 什么是数据清理? -技术百科的定义

什么是数据清理? -技术百科的定义

目录:

Anonim

定义-数据清理是什么意思?

数据清理是指修改或删除数据库中不完整,不正确,格式不正确或重复的数据的过程。 数据清理的主要目的是使数据更加准确和一致。

数据清理是确保数据库保持准确性的重要策略。 在电信,保险,银行和零售等数据密集型行业中,这一点尤其重要。 数据清理借助查找表,规则和算法,系统地评估数据的缺陷或错误。

数据清理也称为数据清理。

Techopedia解释了数据清理

数据库错误很常见,并且可能源于以下原因:

  • 数据输入过程中的人为错误
  • 数据库合并
  • 缺乏行业范围或公司特定的数据标准
  • 包含过时数据的旧系统

过去,数据清理是手动执行的。 这不仅增加了完成该过程所需的时间,而且使该过程更加昂贵并且容易出错。 这导致创建了有效的数据清理工具,该工具可以系统地评估数据中是否存在手动清理过程中无法识别的缺陷。


通常,数据库清理工具包含的解决方案非常适合纠正几种特定类型的错误,例如查找重复的记录或替换丢失的邮政编码。 合并错误或损坏的数据是最复杂的问题。 它甚至被描述为“脏数据”问题,因为它每年花费组织数百万美元。 随着引入具有更多系统和数据的更复杂的业务环境,这种现象正在加剧。 数据清理通过提供强大的数据清理工具来识别和消除数据缺陷,从而帮助组织解决此类问题。

什么是数据清理? -技术百科的定义