當前位置:成語大全網 - 成語詞典 - 如何理解CNN在CV與NLP領域運用的聯系與區別

如何理解CNN在CV與NLP領域運用的聯系與區別

CNN在CV與NLP領域運用的聯系與區別

1、聯系:自然語言處理是對壹維信號(詞序列)做操作,計算機視覺是對二維(圖像)或三維(視頻流)信號做操作。

2、區別:自然語言處理的輸入數據通常是離散取值(例如表示壹個單詞或字母通常表示為詞典中的one hot向量),計算機視覺則是連續取值(比如歸壹化到0,1之間的灰度值)。

CNN有兩個主要特點,區域不變性(location invariance)和組合性(Compositionality)。

1. 區域不變性:濾波器在每層的輸入向量(圖像)上滑動,檢測的是局部信息,然後通過pooling取最大值或均值。pooling這步綜合了局部特征,失去了每個特征的位置信息。這很適合基於圖像的任務,比如要判斷壹幅圖裏有沒有貓這種生物,妳可能不會去關心這只貓出現在圖像的哪個區域。但是在NLP裏,詞語在句子或是段落裏出現的位置,順序,都是很重要的信息。

2. 局部組合性:CNN中,每個濾波器都把較低層的局部特征組合生成較高層的更全局化的特征。這在CV裏很好理解,像素組合成邊緣,邊緣生成形狀,最後把各種形狀組合起來得到復雜的物體表達。在語言裏,當然也有類似的組合關系,但是遠不如圖像來的直接。而且在圖像裏,相鄰像素必須是相關的,相鄰的詞語卻未必相關。