目录:
大数据是海量结构化,非结构化或半结构化数据的流行名称,众所周知,至少使用传统的数据库和软件应用程序很难捕获,存储,管理,共享,分析和可视化大数据。 这就是为什么大数据技术具有有效地管理和处理大量数据的潜力。 Apache Hadoop提供了框架和相关技术,以分布式方式跨计算机集群处理大型数据集。 因此,为了真正理解大数据,您需要了解一些有关Hadoop的知识。 在这里,我们将了解您会听到的有关Hadoop的热门术语-以及它们的含义。
网络研讨会:大铁,见大数据:使用Hadoop和Spark释放大型机数据 在这里注册 |
但首先,看看Hadoop的工作原理
在进入Hadoop生态系统之前,您需要清楚地了解两个基本知识。 首先是文件在Hadoop中的存储方式。 第二个是如何处理存储的数据。 所有与Hadoop相关的技术都主要在这两个领域工作,并使其更加用户友好。 (在Hadoop如何帮助解决大数据问题中获得Hadoop工作原理的基础。)
现在,到条款。