目录:
定义-数据预处理是什么意思?
数据预处理是一种数据挖掘技术,涉及将原始数据转换为可理解的格式。 现实世界中的数据通常不完整,不一致和/或缺少某些行为或趋势,并且可能包含许多错误。 数据预处理是解决此类问题的一种行之有效的方法。 数据预处理将准备原始数据以进行进一步处理。
数据预处理用于数据库驱动的应用程序,例如客户关系管理和基于规则的应用程序(例如神经网络)。
Techopedia解释了数据预处理
数据在预处理过程中要经过一系列步骤:
- 数据清理:通过填充缺失值,平滑嘈杂的数据或解决数据不一致的过程来清理数据。
- 数据集成:将具有不同表示形式的数据放在一起,并解决数据中的冲突。
- 数据转换:对数据进行标准化,汇总和概括。
- 数据缩减:此步骤旨在简化数据仓库中数据的表示形式。
- 数据离散化:通过划分属性间隔范围来减少连续属性的数量。
