基於詞典信息增強的中文醫療領域NER

TODO

在普通的BiLSTM+CRF的NER框架基礎上，加入針對中文的額外編碼方式和醫學領域詞典信息，進壹步增強了模型的表現。

增強方式分為兩種：模式匹配和***同訓練

1. 模式匹配

基於準確的模式匹配，直接得到input sentence的 Term Matching Embedding，加入joint embedding集合。

2.***同訓練

由於文本中某些信息和dictionary中是同壹個意思，但是不完全相同，模式匹配無法匹配到，因此采用***同訓練的方式，即通過訓練使CNN layer學到詞典中NER的knowledge。

TODO