音讯 什么是开源大数据分析? -技术百科的定义

什么是开源大数据分析? -技术百科的定义

目录:

Anonim

定义-开源大数据分析是什么意思?

开源大数据分析是指使用开源软件和工具来分析大量数据,以收集组织可以用来实现其业务目标的相关且可操作的信息。 开源大数据分析的最大参与者是Apache的Hadoop-它是使用最广泛的软件库,用于使用分布式过程进行并行处理跨计算机集群处理大量数据集。

Techopedia解释了开源大数据分析

开源大数据分析利用开源软件和工具来执行大数据分析,方法是使用整个软件平台或各种开源工具来执行数据分析过程中的不同任务。 Apache Hadoop是最著名的大数据分析系统,但是在将真正的分析系统组合在一起之前,还需要其他组件。

Hadoop是Google和Yahoo率先提出的MapReduce算法的开源实现,因此它是当今大多数分析系统的基础。 许多大数据分析工具都使用开源,包括健壮的数据库系统,例如开源MongoDB,这是一个非常适合大数据应用程序以及其他应用程序的复杂且可扩展的NoSQL数据库。

开源大数据分析服务包括:

  • 资料收集系统
  • 管理和监视集群的控制中心
  • 机器学习和数据挖掘库
  • 应用协调服务
  • 计算引擎
  • 执行框架
什么是开源大数据分析? -技术百科的定义