目录:
定义-数据挖掘是什么意思?
数据挖掘是根据不同的角度分析数据的隐藏模式以将其分类为有用信息的过程,该信息在诸如数据仓库之类的公共区域中收集和组装,以进行有效的分析,数据挖掘算法,促进业务决策和其他信息最终削减成本和增加收入的要求。
数据挖掘也称为数据发现和知识发现。
Techopedia解释了数据挖掘
数据挖掘过程涉及的主要步骤是:
- 提取,转换数据并将其加载到数据仓库中
- 在多维数据库中存储和管理数据
- 使用应用软件向业务分析师提供数据访问
- 以易于理解的形式显示分析数据,例如图形
数据挖掘的第一步是收集对业务至关重要的相关数据。 公司数据可以是交易,非运营或元数据。 事务性数据处理日常操作,例如销售,库存和成本等。非操作性数据通常是预测的,而元数据与逻辑数据库设计有关。 数据元素之间的模式和关系提供了相关信息,这可能会增加组织收入。 以消费者为关注重点的组织使用数据挖掘技术来提供销售产品,价格,竞争和客户统计数据的清晰图片。
例如,零售巨头沃尔玛将其所有相关信息传输到具有TB级数据的数据仓库。 供应商可以轻松访问此数据,从而使他们能够确定客户的购买方式。 他们可以利用数据挖掘技术生成购物习惯,大多数购物天数,最需要产品和其他数据的模式。
数据挖掘的第二步是选择合适的算法-一种产生数据挖掘模型的机制。 该算法的一般工作涉及识别一组数据中的趋势,并将输出用于参数定义。 用于数据挖掘的最流行算法是分类算法和回归算法,用于识别数据元素之间的关系。 像Oracle和SQL这样的主要数据库供应商都采用了数据挖掘算法,例如集群和回归树,来满足数据挖掘的需求。