Elasticsearch之配置详解

Stella981
• 阅读 300

配置详解

Cluster

  • 集群名称,默认为elasticsearch: 
    cluster.name: elasticsearch

  • 设置一个节点的并发数量,有两种情况,一种是在初始复苏过程中: 
    cluster.routing.allocation.node_initial_primaries_recoveries: 4 
    另一种是在添加、删除节点及调整时: 
    cluster.routing.allocation.node_concurrent_recoveries: 2

Node

  • 节点名称,es启动时会自动创建节点名称,但你也可进行配置: 
    node.name: elasticsearch-01

  • 是否允许作为主节点,默认值为true: 
    node.master: true

  • 是否存储数据,即存储索引片段,默认值为true: 
    node.data: true

    注意: 
    master和data同时配置会产生一些奇异的效果: 

    • 当master为false,而data为true时,会对该节点产生严重负荷;
    • 当master为true,而data为false时,该节点作为一个协调者;
    • 当master为false,data也为false时,该节点就变成了一个负载均衡器。

     

    你可以通过连接http://localhost:9200/_cluster/health或者http://localhost:9200/_cluster/nodes,或者使用插件http://github.com/lukas-vlcek/bigdeskhttp://mobz.github.com/elasticsearch-head来查看集群状态。

  • 节点自定义属性,可用于后期集群进行碎片分配时的过滤: 
    node.rack: rack-01

Index

  • 设置一个索引的碎片数量,默认值为5: 
    index.number_of_shards: 5
  • 设置一个索引可被复制的数量,默认值为1: 
    index.number_of_replicas: 1

当你不需要分布式时,可进行如下设置:

index.number_of_shards: 1
index.number_of_replicas: 0
  • 1
  • 2

上述两个属性的设置直接影响集群中索引和搜索操作的执行,假设有足够的机器来持有碎片和副本,那么可以按如下规则设置这两个值: 
- 拥有更多的碎片可以提升索引执行能力,并允许通过机器分发一个大型的索引; 
- 拥有更多的副本能够提升搜索执行能力以及集群能力,但副本增多会降低插入和删除操作的效率。

- 对于一个索引来说,number_of_shards一旦设置将不能修改,而number_of_replicas可以使用索引更新设置API在任何时候被增加或者减少;

ElasticSearch关注加载均衡、迁移、从节点聚集结果等等,可以尝试多种设计来完成这些功能,可以连接http://localhost:9200/A/_status来检测索引的状态。

Paths

  • 配置文件所在的位置,即elasticsearch.yml和logging.yml所在的位置: 
    path.conf: /path/to/conf

  • 分配给当前节点的索引数据所在的位置: 
    path.data: /path/to/data 

    可以可选择的包含一个以上的位置,使得数据在文件级别跨越位置,这样在创建时就有更多的自由路径,如: 
    path.data: /path/to/data1,/path/to/data2

  • 临时文件位置: 
    path.work: /path/to/work

  • 日志文件所在位置: 
    path.logs: /path/to/logs

  • 插件安装位置: 
    path.plugins: /path/to/plugins

  • 插件托管位置,若列表中的某一个插件未安装,则节点无法启动: 
    plugin.mandatory: mapper-attachments,lang-groovy

Memory

  • JVM开始交换时,ElasticSearch表现并不好:你需要保障JVM不进行交换,可以将bootstrap.mlockall设置为true禁止交换: 
    bootstrap.mlockall: true 

    请确保ES_MIN_MEM和ES_MAX_MEM的值是一样的,并且能够为ElasticSearch分配足够的内在,并为系统操作保留足够的内存。

Network

  • 默认情况下,ElasticSearch使用0.0.0.0地址,并为http传输开启9200-9300端口,为节点到节点的通信开启9300-9400端口,也可以自行设置IP地址: 
    network.bind_host: 192.168.0.1
  • publish_host设置其他节点连接此节点的地址,如果不设置的话,则自动获取,publish_host的地址必须为真实地址: 
    network.publish_host: 192.168.0.1
  • bind_host和publish_host可以一起设置: 
    network.host: 192.168.0.1
  • 可以定制该节点与其他节点交互的端口: 
    transport.tcp.port: 9300
  • 节点间交互时,可以设置是否压缩,转为为不压缩: 
    transport.tcp.compress: true
  • 可以为Http传输监听定制端口: 
    http.port: 9200
  • 设置内容的最大长度: 
    http.max_content_length: 100mb
  • 禁止HTTP: 
    http.enabled: false

GateWay

  • 网关允许在所有集群重启后持有集群状态,集群状态的变更都会被保存下来,当第一次启用集群时,可以从网关中读取到状态,默认网关类型(也是推荐的)是local: 
    gateway.type: local
  • 允许在N个节点启动后恢复过程: 
    gateway.recover_after_nodes: 1
  • 设置初始化恢复过程的超时时间: 
    gateway.recover_after_time: 5m
  • 设置该集群中可存在的节点上限: 
    gateway.expected_nodes: 2

Indices

  • 设置复苏时的吞吐量,默认情况下是无限的: 
    indices.recovery.max_size_per_sec: 0
  • 设置从对等节点恢复片段时打开的流的数量上限: 
    indices.recovery.concurrent_streams: 5

Discovery

  • 设置一个集群中主节点的数量,当多于三个节点时,该值可在2-4之间: 
    discovery.zen.minimum_master_nodes: 1

  • 设置ping其他节点时的超时时间,网络比较慢时可将该值设大: 
    discovery.zen.ping.timeout: 3s 

    上有更多关于discovery的设置。

  • 禁止当前节点发现多个集群节点,默认值为true: 
    discovery.zen.ping.multicast.enabled: false

  • 设置新节点被启动时能够发现的主节点列表(主要用于不同网段机器连接): 
    discovery.zen.ping.unicast.hosts: ["host1", "host2:port", "host3[portX-portY]"]

Various

  • 在一个系统上禁用启动多个节点: 
    node.max_local_storage_nodes: 1
  • 在删除索引时,是否需要明确指定名称,该值为false时,将可以通过正则或_all进行所以 删除: 
    action.destructive_requires_name: true

--------------------- 作者:Yashon1990 来源:CSDN 原文:https://blog.csdn.net/hyx1990/article/details/52892026?utm\_source=copy 来源声明

点赞
收藏
评论区
推荐文章
blmius blmius
2年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Jacquelyn38 Jacquelyn38
2年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Stella981 Stella981
2年前
Opencv中Mat矩阵相乘——点乘、dot、mul运算详解
Opencv中Mat矩阵相乘——点乘、dot、mul运算详解2016年09月02日00:00:36 \牧野(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fme.csdn.net%2Fdcrmg) 阅读数:59593
Stella981 Stella981
2年前
KVM调整cpu和内存
一.修改kvm虚拟机的配置1、virsheditcentos7找到“memory”和“vcpu”标签,将<namecentos7</name<uuid2220a6d1a36a4fbb8523e078b3dfe795</uuid
Wesley13 Wesley13
2年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
2年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
2年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Wesley13 Wesley13
2年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
4个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这