配置详解

Cluster

集群名称，默认为elasticsearch：
cluster.name: elasticsearch
设置一个节点的并发数量，有两种情况，一种是在初始复苏过程中：
cluster.routing.allocation.node_initial_primaries_recoveries: 4
另一种是在添加、删除节点及调整时：
cluster.routing.allocation.node_concurrent_recoveries: 2

Node

节点名称，es启动时会自动创建节点名称，但你也可进行配置：
node.name: elasticsearch-01
是否允许作为主节点，默认值为true：
node.master: true
是否存储数据，即存储索引片段，默认值为true：
node.data: true
注意：
master和data同时配置会产生一些奇异的效果：
- 当master为false，而data为true时，会对该节点产生严重负荷；
- 当master为true，而data为false时，该节点作为一个协调者；
- 当master为false，data也为false时，该节点就变成了一个负载均衡器。
你可以通过连接http://localhost:9200/_cluster/health或者http://localhost:9200/_cluster/nodes，或者使用插件http://github.com/lukas-vlcek/bigdesk或http://mobz.github.com/elasticsearch-head来查看集群状态。
节点自定义属性，可用于后期集群进行碎片分配时的过滤：
node.rack: rack-01

Index

设置一个索引的碎片数量，默认值为5：
index.number_of_shards: 5
设置一个索引可被复制的数量，默认值为1：
index.number_of_replicas: 1

当你不需要分布式时，可进行如下设置：
index.number_of_shards: 1
index.number_of_replicas: 0
1

2

上述两个属性的设置直接影响集群中索引和搜索操作的执行，假设有足够的机器来持有碎片和副本，那么可以按如下规则设置这两个值：
- 拥有更多的碎片可以提升索引执行能力，并允许通过机器分发一个大型的索引；
- 拥有更多的副本能够提升搜索执行能力以及集群能力，但副本增多会降低插入和删除操作的效率。

- 对于一个索引来说，number_of_shards一旦设置将不能修改，而number_of_replicas可以使用索引更新设置API在任何时候被增加或者减少；

ElasticSearch关注加载均衡、迁移、从节点聚集结果等等，可以尝试多种设计来完成这些功能，可以连接http://localhost:9200/A/_status来检测索引的状态。

Paths

配置文件所在的位置，即elasticsearch.yml和logging.yml所在的位置：
path.conf: /path/to/conf
分配给当前节点的索引数据所在的位置：
path.data: /path/to/data

可以可选择的包含一个以上的位置，使得数据在文件级别跨越位置，这样在创建时就有更多的自由路径，如：
path.data: /path/to/data1,/path/to/data2
临时文件位置：
path.work: /path/to/work
日志文件所在位置：
path.logs: /path/to/logs
插件安装位置：
path.plugins: /path/to/plugins
插件托管位置，若列表中的某一个插件未安装，则节点无法启动：
plugin.mandatory: mapper-attachments,lang-groovy

Memory

JVM开始交换时，ElasticSearch表现并不好：你需要保障JVM不进行交换，可以将bootstrap.mlockall设置为true禁止交换：
bootstrap.mlockall: true

请确保ES_MIN_MEM和ES_MAX_MEM的值是一样的，并且能够为ElasticSearch分配足够的内在，并为系统操作保留足够的内存。

Network

默认情况下，ElasticSearch使用0.0.0.0地址，并为http传输开启9200-9300端口，为节点到节点的通信开启9300-9400端口，也可以自行设置IP地址：
network.bind_host: 192.168.0.1
publish_host设置其他节点连接此节点的地址，如果不设置的话，则自动获取，publish_host的地址必须为真实地址：
network.publish_host: 192.168.0.1
bind_host和publish_host可以一起设置：
network.host: 192.168.0.1
可以定制该节点与其他节点交互的端口：
transport.tcp.port: 9300
节点间交互时，可以设置是否压缩，转为为不压缩：
transport.tcp.compress: true
可以为Http传输监听定制端口：
http.port: 9200
设置内容的最大长度：
http.max_content_length: 100mb
禁止HTTP:
http.enabled: false

GateWay

网关允许在所有集群重启后持有集群状态，集群状态的变更都会被保存下来，当第一次启用集群时，可以从网关中读取到状态，默认网关类型（也是推荐的）是local：
gateway.type: local
允许在N个节点启动后恢复过程：
gateway.recover_after_nodes: 1
设置初始化恢复过程的超时时间：
gateway.recover_after_time: 5m
设置该集群中可存在的节点上限：
gateway.expected_nodes: 2

Indices

设置复苏时的吞吐量，默认情况下是无限的：
indices.recovery.max_size_per_sec: 0
设置从对等节点恢复片段时打开的流的数量上限：
indices.recovery.concurrent_streams: 5

Discovery

设置一个集群中主节点的数量，当多于三个节点时，该值可在2-4之间：
discovery.zen.minimum_master_nodes: 1
设置ping其他节点时的超时时间，网络比较慢时可将该值设大：
discovery.zen.ping.timeout: 3s

上有更多关于discovery的设置。
禁止当前节点发现多个集群节点，默认值为true：
discovery.zen.ping.multicast.enabled: false
设置新节点被启动时能够发现的主节点列表（主要用于不同网段机器连接）：
discovery.zen.ping.unicast.hosts: ["host1", "host2:port", "host3[portX-portY]"]