分页

GET /_search
{
    "from" : 0, "size" : 10,
    "query" : {
        "term" : { "user" : "kimchy" }
    }
}

排序

POST /_search
{
   "query" : {
      "term" : { "product" : "chocolate" }
   },
   "sort" : [
      {"price" : {"order" : "asc", "mode" : "avg"}}
   ]
}

in 或者 not in 查询

GET /kibana_sample_data_logs/_search
{
  "query": {
    "bool": {
    // must是：in 查询，must_not：是 not in 查询
      "must": [
        {
          "terms": {
            "clientip": ["118.151.35.151", "254.207.11.2"]
          }
        }
      ]
    }
  },
  "sort": [
    {
      "utc_time": {
        "order": "desc"
      }
    }
  ],
  "from": 0, "size": 20
}

BoolQueryBuilder boolBuilder = QueryBuilders.boolQuery();
boolBuilder.must(QueryBuilders.matchPhraseQuery("param", "1"));
boolBuilder.must(QueryBuilders.matchPhraseQuery("param", "2"));
boolBuilder.must(QueryBuilders.matchPhraseQuery("param", "3"));

or and 条件查询

1.must
文档 必须 匹配这些条件才能被包含进来。相当于sql中的 and
2.must_not
文档 必须不 匹配这些条件才能被包含进来。相当于sql中的 not
3.should
如果满足这些语句中的任意语句，将增加 _score ，否则，无任何影响。它们主要用于修正每个文档的相关性得分。相当于sql中的or
4.filter
必须 匹配，但它以不评分、过滤模式来进行。这些语句对评分没有贡献，只是根据过滤标准来排除或包含文档。

构造查询条件
1. termQuery：精确查询（不分词）
使用termQuery要注意的是，Elasticsearch5之后，取消了string类型，将原来的string类型拆分为text和keyword两种类型，他们的区别在于text会对字段进行分词处理，而keyword则不会。
2. matchQuery：匹配查询（分词）
match query搜索的时候，首先会解析查询字符串，进行分词，然后查询，所以假如我搜索的条件输入的是"六年级"，则会把各个年级（一年级至九年级）的数据都查询出来，因为其中都包含’年级’ 。
3. queryString：精确查询
4. wildcardQuery：模糊查询
5. rangeQuery：范围查询

多字段搜索

GET /kibana_sample_data_logs/_search
{
  "query": {
    "multi_match": {
      "query": "你好 www.elastic.co Chrome",
      "fields": ["message", "host"]
    }
  }
}

operator: 可以设置为 or(默认) 或者 and

和分词有关系：
如：数据是：万里长城真伟大
分词后：["万里长城", "万里","万","里长","里","长城" ...]
为or时：
索引库中，只要文档的content这个字段内容包含“万里长城”，“里”，“真”，“伟大”等任何一个分词，该条文档就会被索引到。

为and时：
索引库中，文档的content这个字段必须包含“万里长城”，“里”，“真”，“伟大”等所有分词 ，这就是and。

java api

注意点 RefreshPolicy

默认情况下ElasticSearch索引的refresh_interval为1秒，这意味着数据写1秒才就可以被搜索到。

每次索引refresh会产生一个新的 lucene 段，这会导致频繁的 segment merge 行为，对系统 CPU 和 IO 占用都比较高。

如果产品对于实时性要求不高，则可以降低刷新周期，如：index.refresh_interval: 120s。

但是这种特性对于功能测试来说比较麻烦：

因为实时性不能保证，所以每次插入测试数据之后，都需要sleep一段时间，才能进行测试。
因为实时性不能保证，及时通过sleep策略通过的case，也可能偶尔失败。
为了解决上述问题，需要提供ElasticSearch增删改数据之后数据立即刷新的策略。
可知有以下三种刷新策略：

RefreshPolicy#IMMEDIATE:
请求向ElasticSearch提交了数据，立即进行数据刷新，然后再结束请求。
优点：实时性高、操作延时短。
缺点：资源消耗高。
RefreshPolicy#WAIT_UNTIL:
请求向ElasticSearch提交了数据，等待数据完成刷新，然后再结束请求。
优点：实时性高、操作延时长。
缺点：资源消耗低。
RefreshPolicy#NONE:
默认策略。
请求向ElasticSearch提交了数据，不关系数据是否已经完成刷新，直接结束请求。
优点：操作延时短、资源消耗低。
缺点：实时性低
updateRequest.setRefreshPolicy(WriteRequest.RefreshPolicy.WAIT_UNTIL);
每笔500ms以上，特别影响性能。尽量不要使用
————————————————
版权声明：本文为CSDN博主「小影1022」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/weixin_43661484/article/details/107195385

Gyo

粤ICP备18155512号-1

elasticsearch查询

分页

排序

in 或者 not in 查询

or and 条件查询

多字段搜索

operator: 可以设置为 or(默认) 或者 and

java api

注意点 RefreshPolicy