资料库 什么是Apache Lucene? -技术百科的定义

什么是Apache Lucene? -技术百科的定义

目录:

Anonim

定义-Apache Lucene是什么意思?

Apache Lucene是一个开放源代码项目,用于高性能和全功能的文本搜索引擎库,该库完全使用Java编写。

它能够在文档中进行全文搜索,因此,该技术适用于需要此功能的任何应用程序,尤其是跨平台的应用程序。

它由Doug Cutting于1999年首先开发,并于2001年9月正式成为Apache基金会的Jakarta开源Java项目家族的一部分。它于2005年2月升级为顶级Apache项目。

Techopedia解释了Apache Lucene

Apache Lucene是一个高性能的搜索引擎,其核心逻辑体系结构具有“包含文本字段的文档”的概念。 这提供了极大的灵活性,并允许Lucene API变得独立于任何文件格式。


只要可以提取文本信息,就可以索引来自MS Word,HTML,XML,PDF和OpenDocument等格式的任何文本,这意味着它不能对图像执行任何操作。


Lucene适合需要全文索引和搜索功能的任何应用程序,但它被广泛认为是实现Internet搜索引擎以及本地,单站点搜索的强大工具。


功能包括:

  • 可扩展的高性能索引-它在现代硬件上每小时可以处理150 Gb以上的数据,并且每堆内存需求仅需要1 Mb。
  • 强大,准确和高效的搜索算法-它提供了许多类型的强大查询,例如词组查询,通配符查询,接近查询和范围查询。 它还可以按任何字段进行搜索和排序。
  • 跨平台-纯Java实现,也可以使用其他编程语言。
什么是Apache Lucene? -技术百科的定义