
Lucene
文章平均质量分 92
桃花惜春风
高级Elasticsearch工程师,搜索架构工程师
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Elasticsearch原理(九):相关性排序算法详解
Elasticsearch中的相关性算法主要还是基于Lucene的相关性算法,Lucene的算法是基于TF-IDF的,但和TF-IDF还是有些区别。那么我们就从TF-IDF开始介绍。TF-IDF定义TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。TF是词频(Term Frequency),IDF是逆文本频率指数(Inverse Document Frequency)。(来源百度百科)算法核心TF-IDF实原创 2020-08-20 10:46:15 · 3483 阅读 · 0 评论 -
Lucene原理(一):基本概念
Apache Lucene是Apache的一个核心开源项目,是目前最好的搜索框架。扩展性强,支持全文检索,各种各样的数据结构,支持不同的查询需求。目前使用Apache Lucene最好的两款开源软件:Apache solr,Apache 旗下的开源搜索引擎,支持各种数据格式的检索(json、pdf、csv等),实时性较差Elasticsearch,目前最火的开源搜索引擎,实时性...原创 2018-09-15 18:15:52 · 4771 阅读 · 0 评论