音讯 什么是Hadoop生态系统? -技术百科的定义

什么是Hadoop生态系统? -技术百科的定义

目录:

Anonim

定义-Hadoop生态系统是什么意思?

Hadoop生态系统指的是Apache Hadoop软件库的各个组件,以及Apache软件基金会为这些类型的软件项目提供的附件和工具,以及它们协同工作的方式。

Hadoop是基于Java的框架,在处理和分析大量数据方面非常流行。

Techopedia解释了Hadoop生态系统

核心Hadoop软件包及其附件都主要是Apache许可的开源项目。 Hadoop生态系统的想法涉及使用核心Hadoop集的不同部分,例如MapReduce(一种用于处理大量数据的框架)以及Hadoop Distributed File System(HDFS)(一种复杂的文件处理系统)。 还有YARN,一个Hadoop资源管理器。

除了Hadoop的这些核心元素外,Apache还为开发人员提供了其他种类的附件或补充工具。 其中包括数据分析工具Apache Hive。 Apache Spark,用于处理大数据的通用引擎; Apache Pig,一种数据流语言; HBase,一种数据库工具; 还有Ambarl,它可以被视为Hadoop生态系统管理器,因为它有助于一起管理这些各种Apache资源的使用。 随着Hadoop成为事实上的数据收集标准并在许多组织中无处不在,管理人员和开发领导者正在学习有关Hadoop生态系统的全部知识,以及Hadoop通用设置中涉及的事物。

什么是Hadoop生态系统? -技术百科的定义