TODO
TODO
在普通的BiLSTM+CRF的NER框架基礎上,加入針對中文的額外 編碼方式 和 醫學領域詞典 信息,進壹步增強了模型的表現。
增強方式分為兩種:模式匹配和***同訓練
1. 模式匹配
基於準確的模式匹配,直接得到input sentence的 Term Matching Embedding,加入joint embedding集合。
2.***同訓練
由於文本中某些信息和dictionary中是同壹個意思,但是不完全相同,模式匹配無法匹配到,因此采用***同訓練的方式,即通過訓練使CNN layer學到詞典中NER的knowledge。
TODO
TODO