當前位置:成語大全網 - 新華字典 - 如何使用Elasticsearch groovy script腳本更新數據

如何使用Elasticsearch groovy script腳本更新數據

今天細說壹下elasticsearch的update更新功能,以及如何利用script腳本更新數據。

想要使用script腳本功能,需要在配置文件elasticsearch.yml裏設置

Python

script.disable_dynamic: false

關於elasticsearch script的文章,總是會沒完沒了的修改

ES支持更新,但是更新的方式是通過壹個提供的腳本進行的。ES的做法是,通過

index找到相應的存放記錄的節點,然後執行腳本,執行完之後,返回新的索引。實際上執行的是壹個get和reindex的過程,在這個過程中,通過

versioning來控制沒有其它的更新操作(這個功能是0.19後可用的)。具體實現的原理應該和elasticsearch

Versioning相關。

get,reindex的含義是,ES先取出這條記錄,然後根據新數據生成新記錄,然後在把新記錄放回到ES中(並不會覆蓋老的記錄)。

現在沒有數據,首先我們需要創建壹條記錄

Python

$ curl -XPUT localhost:9200/xiaorui.cc/blog/1 -d '{

"counter" : 1,

"tags" : ["red"]

}'

$ curl -XPUT localhost:9200/xiaorui.cc/blog/1 -d '{

"counter" : 1,

"tags" : ["red"]

}'

直接修改數據,壹定要註意,直接update的化,會覆蓋以前的數據,另外update的時候,需要/index/type/id ,壹定要帶著id。 elasticsearch 應該不支持搜索query方式update修改數據。

Python

curl -XPUT 'localhost:9200/xiaorui.cc/blog/1?pretty' -d '

{

"name": "xiaorui.cc"

}'

curl -XPUT 'localhost:9200/xiaorui.cc/blog/1?pretty' -d '

{

"name": "xiaorui.cc"

}'

elasticsearch提供了doc這個局部更新參數,他可以局部修改,而不會直接覆蓋以前的數據,這會針對特定的k v,字段修改。

Python

curl -XPOST 'localhost:9200/xiaorui.cc/blog/1/_update?pretty' -d '

{

"doc": { "name": "ruifengyun" }

}'

curl -XPOST 'localhost:9200/xiaorui.cc/blog/1/_update?pretty' -d '

{

"doc": { "name": "ruifengyun" }

}'

當Elasticsearch API不能滿足要求時,Elasticsearch允許妳使用腳本實現自己的邏輯。腳本支持非常多的API,例如搜索、排序、聚合和文檔更新。腳本可以通過請求的壹部分、檢索特殊的.scripts索引或者從磁盤加載方式執行。

下面是es script的用法,這些腳本是groovy開發的。 下面的語句的意思是說,將counter的值加4

Python

$ curl -XPOST 'localhost:9200/xiaorui.cc/blog/1/_update' -d '{

"script" : "ctx._source.counter += count",

"params" : {

"count" : 4

}

}'

$ curl -XPOST 'localhost:9200/xiaorui.cc/blog/1/_update' -d '{

"script" : "ctx._source.counter += count",

"params" : {

"count" : 4

}

}'

通過上面的例子,我們知道tags是個列表,如果用doc局部更新的語法,他是無法做到append的,還是會覆蓋tags這個字段。 那麽怎麽實現列表擴展? 請使用elasticsearch script實現。

Python

$ curl -XPOST 'localhost:9200/xiaorui.cc/blog/1/_update' -d '{

"script" : "ctx._source.tags += tag",

"params" : {

"tag" : "white"

}

}'

$ curl -XPOST 'localhost:9200/xiaorui.cc/blog/1/_update' -d '{

"script" : "ctx._source.tags += tag",

"params" : {

"tag" : "white"

}

}'

_update也支持upsert功能,沒有這個字段或者key,也會添加這個記錄。下面是壹個例子,如果沒有counter字段,則插入該字段:

Python

$ curl -XPOST 'localhost:9200/xiaorui.cc/blog/1/_update' -d '{

"script" : "ctx._source.counter += count",

"params" : {

"count" : 4

},

"upsert" : {

"counter" : 1

}

}'

$ curl -XPOST 'localhost:9200/xiaorui.cc/blog/1/_update' -d '{

"script" : "ctx._source.counter += count",

"params" : {

"count" : 4

},

"upsert" : {

"counter" : 1

}

}'

下面我們來復雜點的groovy script腳本用法. 當妳的source沒有china這個key,那麽我會增加壹個kv

Python

curl -XPOST "http://localhost:9200/xiaorui.cc/blog/80/_update" -d'

{

"script": "if (!ctx._source.containsKey(\"china\")) { ctx._source.attending = newField }",

"params" : {"newField" : "blue" },

"myfield": "data"

}'

curl -XPOST "http://localhost:9200/xiaorui.cc/blog/80/_update" -d'

{

"script": "if (!ctx._source.containsKey(\"china\")) { ctx._source.attending = newField }",

"params" : {"newField" : "blue" },

"myfield": "data"

}'

下面的script語法相對復雜的,會遍歷壹組字典,然後進行判斷賦值。

{

“55555″: 22,

“name”: “lisi”,

“distr_pan”: [

{

“k”: 15,

“v”: 15

},

{

“k”: 20,

“v”: 20

}

]

}

Python

$ curl -XPUT 'localhost:9200/xiaorui.cc/blog/9123/_update' -d '

{

"script" : "def x = false;ctx._source.distr_pan.each({if(it.get('k')==target){x=true}});if(x){ctx._source.distr_pan +=v}",

"params":{

"v":{"k":nlp, "v":35},

"target":15

}

}

$ curl -XPUT 'localhost:9200/xiaorui.cc/blog/9123/_update' -d '

{

"script" : "def x = false;ctx._source.distr_pan.each({if(it.get('k')==target){x=true}});if(x){ctx._source.distr_pan +=v}",

"params":{

"v":{"k":nlp, "v":35},

"target":15

}

}

elasticsearch script就講解到這裏了,很多例子已經簡單明了…

script貌似不是很安全,最少遠程代碼執行的漏洞暴露過幾次了. 下次把python版的script走壹遍試試.

貌似對於我們妳者來說,不管是groovy python,沒什麽太大卻別,語法看起來都壹個模子。