目录:
定义-Apache Nutch是什么意思?
Apache Nutch是一种Web搜寻器软件产品,可用于从Web聚合数据。 它与其他Apache工具(例如Hadoop)一起用于数据分析。
Techopedia解释了Apache Nutch
Apache Nutch是Apache Software Foundation许可的开源产品。 该开发者社区拥有可对数据进行排序和分析的一系列Apache软件工具的许可证。 核心技术之一是Apache Hadoop,这是一种在商业社区中非常流行的大数据分析工具。
连同Apache Hadoop之类的工具以及文件存储,分析等功能,Nutch的作用是通过使用Web爬网算法从Web收集和存储数据。
用户可以利用Apache Nutch中的简单命令来收集URL下的信息。 用户通常将Apache Nutch与另一个开源工具(称为Apache Solr的框架)一起使用,该工具可以充当通过Apache Nutch收集的数据的存储库。
