目录:
定义-数据质量是什么意思?
数据质量是从不同角度衡量数据属性的一种复杂方式。 它是对数据(尤其是数据仓库中的数据)的应用效率,可靠性和适用性的全面检查。
在组织内部,足够的数据质量对于事务和运营流程以及业务智能(BI)和业务分析(BA)报告的寿命至关重要。 数据质量可能会受到输入,处理和维护数据的方式的影响。
数据质量保证(DQA)是旨在验证数据效率和可靠性的过程。
技术百科解释了数据质量
有效的数据质量维护需要定期的数据监视和清理。 通常,数据质量维护涉及更新/标准化数据以及对记录进行重复数据删除以创建单个数据视图。
关键数据质量组件如下:
- 完整性:提供所需数据属性的级别。 数据不需要100%完整。
- 准确性:代表数据的真实状态。 可以在各种列表和映射的帮助下使用自动方法来计算。
- 可信度:数据被认为可信和真实的程度。 可能因来源而异。
- 及时性(数据量):针对当前企业适当更新数据的程度。
- 一致性:评估各种数据集事实是否匹配。
- 完整性:评估参考有效性和各种数据集的准确连接。
数据质量至关重要,原因如下:
- 它提供准确且及时的信息来处理问责制和服务。
- 它提供了及时的信息来处理服务有效性。
- 它有助于确定优先级并保证有效的资源利用。
