写在前面
在ElasticSearch之Mapping 一文中我们一起看了es的dynamic mapping机制,通过该机制允许我们不需要显式的定义mapping信息,而是es根据插入的文档值来自动生成 ,比如插入如下的文档:
{
"firstName": "Chan",
"lastName": "Jackie",
"loginDate": "2018-07-24"
}
其中firstName和lastName会被映射为text类型,并自动添加keyword类型的子字段 ,loginDate因为数据格式符合日期类型被自动映射为date类型。考虑这样的需求,我们不希望给text类型的字段自动应用多字段,即增加keyword类型的子字段,并且我们也不希望当插入的数据时日期类型时不要映射为date类型,该怎么做呢?此时就可以考虑使用index template,在索引的级别之上来定义所有字段的mapping规则。index template不仅可以来对索引的mapping信息做全局的定义,还可以对index的setting信息做全局定义,如定义分片数,副本数,例子如下:
如果我们向对字段类型做更加精细的控制,即控制某个字段自动映射的类型,如当某个字段是以is
开头时,则自动映射为Boolean类型,此时就需要使用到Dynamic Template机制了,如下例子:
本部分我们就来详细看下index template机制和dynamic template机制。
1:index template
在es中我们可能需要定义非常多的index,我们可以通过index template来全局的设置某些索引多少分片,多少副本,如何mapping等,这样就不需要每个索引单独指定了,具体关于index tempate直接看下图:
例子:
工作方式:
接着来看demo:
- 创建2个index template并查看
第一个索引是tempate_default,第二索引是tempate_test。
# 1:创建第一个index template
# 匹配所有的索引,设置setting,分片和副本都是1
PUT _template/tempate_default
{
"index_patterns": ["*"],
"order": 0,
"version": 1,
"settings": {
"number_of_shards": 1,
"number_of_replicas": 6
}
}
# 2:创建第二个template,匹配test开头的索引,再setting中设置分片为1,副本
# 为2,在mapping中设置不自动检测date类型,自动检测整数类型
PUT _template/tempate_test
{
"index_patterns": ["test*"],
"order": 1,
"settings": {
"number_of_shards": 1,
"number_of_replicas": 2
},
"mappings": {
"date_detection": false,
"numeric_detection": true
}
}
# 3:查看定义的两个index template
GET _template/tempate_*
- 创建1个只匹配tempate_default的索引
- 创建1个匹配tempate_test的索引并查看mapping和setting
# 1:创建匹配template_default的索引
PUT test_idx/_doc/1
{
"someKey": "someVal"
}
# 2:查看索引的mapping
GET test_idx/_settings
# 2:查看索引的setting
GET test_idx/_mapping
setting和mapping信息如下图:
- 创建1个自定义了mapping和seting的索引
# 1:创建自定义了mapping和setting和index
# 在setting中设置副本数为4,在mapping中设置打开自动日期类型检测
PUT assign_idx
{
"settings": {
"number_of_replicas" : 4
},
"mappings": {
"date_detection" : true
}
}
# 2:查看mapping和setting
GET assign_idx/_mapping
GET assign_idx/_settings
mapping和setting如下,可以看到使用了自定义的配置:
2:dynamic template
通过dynamic template是一种根据识别出的类型信息,以及字段名称等来动态设置字段mapping信息的一种机制,如下图:
看几个例子。
- 如果text并且以is开头的则映射为Boolean类型,否则类型映射为keyword
首先来定义索引:
DELETE myidx
PUT myidx
{
"mappings": {
"dynamic_templates": [
{
"strings_to_boolean": {
"match_mapping_type": "string",
"match": "is*",
"mapping": {
"type": "boolean"
}
}
},
{
"strings_to_keyword": {
"match_mapping_type": "string",
"mapping": {
"type": "keyword"
}
}
}
]
}
}
解释如下:
接着我们来插入一个文档:
- 根据文档路径来定义mapping信息
首先来定义索引:
DELETE myidx
PUT myidx
{
"mappings": {
"dynamic_templates": [
{
"copy_to_fullname": {
"path_match": "name.*",
"path_unmatch": "*.middle",
"mapping": {
"type": "text",
"copy_to": "full_name"
}
}
}
]
}
}
解释如下:
插入文档:
尝试搜索 full_name:
# 可以搜索到,因为first由copy_to
GET myidx/_search?q=full_name:"111"
# 搜索不到,因为middle没有copy_to
GET myidx/_search?q=full_name:"222"
# 可以搜索到,因为last由copy_to
GET myidx/_search?q=full_name:"333"
3:dynamic mapping,index template,dynamic template
dynamic mapping 是一种es自动根据值来生成mapping信息的一种机制。index template是在索引级别上来预定义mapping和setting信息的一种机制,dynamic tempalte是在字段级别上来预定义mapping信息的一种机制。
写在后面
参考文章列表
ElasticSearch之Mapping