音讯 什么是apache kudu? -技术百科的定义

什么是apache kudu? -技术百科的定义

目录:

Anonim

定义-Apache Kudu是什么意思?

Apache Kudu是开源Apache Hadoop生态系统的成员。 它是一种开放源代码存储引擎,用于结构化数据,支持低延迟随机访问以及有效的分析访问模式。 它的设计和实现是为了弥合广泛使用的Hadoop分布式文件系统(HDFS)和HBase NoSQL数据库之间的差距。 尽管这些系统可能仍然被证明是有优势的,但是Apache Kudu可以满足许多常见的工作负载,因为它可以大大简化其体系结构。

Techopedia解释了Apache Kudu

Apache Kudu最初是作为Cloudera的一个项目开发的。 迄今为止,大多数贡献都是由Cloudera雇用的开发人员提供的。 在发布期间,Cloudera的存储库中仅包含便利二进制文件,但是在加入孵化器后,它采用了Apache Software Foundation(ASF)源发布过程。 它是专门为需要对快速数据进行快速分析的用例而设计的。 它旨在利用下一代硬件和内存处理技术。 对于Apache Impala和Apache Spark,它大大降低了查询延迟。 它通过列式存储引擎或水平分区来分发数据,然后使用Raft共识复制每个分区,从而提供较低的平均恢复时间和较低的延迟时间。

尽管Kudu是在Apache Hadoop生态系统的上下文中设计的产品,但它还支持与ASF内外的其他数据分析项目集成。

Apache Kudu被证明是高效的,因为它可以在单个存储层上处理实时分析工作负载,从而使架构师可以灵活地解决各种用例,而无需采用其他解决方法。

什么是apache kudu? -技术百科的定义