待辦事項
在BiLSTM+CRF的通用NER框架的基礎上,增加了中文和醫學詞典信息的額外編碼方法,以進壹步增強模型的性能。
有兩種增強方法:模式匹配和* * *訓練。
1.模式匹配
在精確模式匹配的基礎上,直接獲得輸入情感的$ Term匹配嵌入並加入到聯合嵌入集中。
2.***相同的培訓
因為文本中的某些信息與字典中的含義相同,但並不完全相同,所以模式匹配無法匹配。因此,采用* * *的訓練方法,即CNN層通過訓練學習NER在字典中的知識。