ES实现搜素建议

Wesley13
• 阅读 606

1. 什么是搜索建议?

帮助⽤户在搜索的过程,对输入中进行纠错,提示建议性词语。

例如:

ES实现搜素建议

2. ES实现原理

输⼊的⽂本分解为 Token,然后在索引的字典里查找相似的 Term 并返回。

3. 对应API,Term& Phrase Suggester

TermSuggester

3种Suggestion Mode

Missing – 如索引中已经存在,就不提供建议

Popular – 推荐出现频率更加⾼的词

Always – ⽆论是否存在,都提供建议

一个排序

默认按照 score 排序,也可以按照“frequency”

首字母限制

默认⾸字⺟不⼀致,就不会匹配推荐。解决方法,将 prefix_length 设置为 0,

Phrase Suggester

Suggest Mode :missing, popular, always 

Max Errors:最多可以拼错的 Terms 数

Confidence:限制返回结果数,默认为1,只有分数高过设定值时,才会返回。

4. 例子

# 删除之前的Index
DELETE articles
# 插入2个测试数据
POST articles/_bulk
{ "index" : { } }
{ "body": "elasticsearch is good"}
{ "index" : { } }
{ "body": "elasticsearch is ok"}

2. 调用查询api

POST /articles/_search
{
  "size": 1,
  "query": {
    "match": {
      "body": "elasticseach"
    }
  },
  "suggest": {
    "term-suggestion": {
      "text": "elasticseach",
      "term": {
        "suggest_mode": "missing",
        "field": "body"
      }
    }
  }
}

对应结果

{
  "took" : 13,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 0,
      "relation" : "eq"
    },
    "max_score" : null,
    "hits" : [ ]
  },
  "suggest" : {
    "term-suggestion" : [
      {
        "text" : "elasticseach",
        "offset" : 0,
        "length" : 12,
        "options" : [
          {
            "text" : "elasticsearch",
            "score" : 0.9166667,
            "freq" : 2
          }
        ]
      }
    ]
  }
}

option部分就是对应的推荐词

5. 引用文档

https://www.elastic.co/guide/en/elasticsearch/reference/7.1/search-suggesters.html

https://www.elastic.co/guide/en/elasticsearch/reference/7.1/search-suggesters-term.html

https://www.elastic.co/guide/en/elasticsearch/reference/7.1/search-suggesters-phrase.html

点赞
收藏
评论区
推荐文章
blmius blmius
2年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Jacquelyn38 Jacquelyn38
2年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Stella981 Stella981
2年前
Android So动态加载 优雅实现与原理分析
背景:漫品Android客户端集成适配转换功能(基于目标识别(So库35M)和人脸识别库(5M)),导致apk体积50M左右,为优化客户端体验,决定实现So文件动态加载.!(https://oscimg.oschina.net/oscnet/00d1ff90e4b34869664fef59e3ec3fdd20b.png)点击上方“蓝字”关注我
Wesley13 Wesley13
2年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
2年前
Js使用面向对象和面向过程的方法实现拖拽物体的效果
1.面向过程的拖拽实现代码:!(https://oscimg.oschina.net/oscnet/d680c759957babef2fec0902676eaa35ad9.gif)<!DOCTYPEhtml<html<head<titledragDiv</title
Wesley13 Wesley13
2年前
35岁是技术人的天花板吗?
35岁是技术人的天花板吗?我非常不认同“35岁现象”,人类没有那么脆弱,人类的智力不会说是35岁之后就停止发展,更不是说35岁之后就没有机会了。马云35岁还在教书,任正非35岁还在工厂上班。为什么技术人员到35岁就应该退役了呢?所以35岁根本就不是一个问题,我今年已经37岁了,我发现我才刚刚找到自己的节奏,刚刚上路。
Wesley13 Wesley13
2年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
为什么mysql不推荐使用雪花ID作为主键
作者:毛辰飞背景在mysql中设计表的时候,mysql官方推荐不要使用uuid或者不连续不重复的雪花id(long形且唯一),而是推荐连续自增的主键id,官方的推荐是auto_increment,那么为什么不建议采用uuid,使用uuid究
Python进阶者 Python进阶者
3个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这