當前位置:成語大全網 - 成語詞典 - 基於詞典信息增強的中文醫療領域NER

基於詞典信息增強的中文醫療領域NER

TODO

TODO

在普通的BiLSTM+CRF的NER框架基礎上,加入針對中文的額外 編碼方式 和 醫學領域詞典 信息,進壹步增強了模型的表現。

增強方式分為兩種:模式匹配和***同訓練

1. 模式匹配

基於準確的模式匹配,直接得到input sentence的 Term Matching Embedding,加入joint embedding集合。

2.***同訓練

由於文本中某些信息和dictionary中是同壹個意思,但是不完全相同,模式匹配無法匹配到,因此采用***同訓練的方式,即通過訓練使CNN layer學到詞典中NER的knowledge。

TODO

TODO