將圖像劃分為語義像素級,並通過實例對分割對象進行進壹步分類。
基於圖像的灰度特性計算壹個或多個灰度閾值,並將圖像中每個像素的灰度值與閾值進行比較。最後,根據比較結果將像素分類到適當的類別中。
確定壹個準則函數來求解最佳灰度閾值。閾值法特別適用於目標和背景占據不同灰度範圍的圖形。
值得壹提的是,這種方法也可用於特征點檢測。
直接尋找該區域。有兩種基本形式:壹種是區域增長,從單個像素開始,逐漸合並以形成所需的分割區域;另壹種是從全局出發,逐步切入所需的細分領域。
基於邊緣檢測的圖像分割算法試圖通過檢測包含不同區域的邊緣來解決分割問題。可以說是人們最早想到、研究最多的方法之壹。通常,不同區域邊界上像素的灰度值變化劇烈。如果通過傅裏葉變換將圖像從空間域變換到頻率域,則邊緣對應於高頻部分,這是壹種非常簡單的邊緣檢測算法。
傳統卷積
常規卷積+殘差解梯度消失,網絡變得更深。
高效神經網絡
ResNet-38
全分辨率殘差網絡(FRRN)
阿達普尼
從目標檢測發展而來(R-CNN,快速R-CNN)
在快速R-CNN結構的基礎上,增加了掩模預測分支,並改進了ROI Pooling,提出了ROI Align。
評估函數只對用於目標檢測的候選框進行評分,而不是劃分模板。
(1)ReSeg模型FCN的改進
FCN的不足:沒有考慮局部或全局上下文依賴,這在語義分割中非常有用。因此,在ReSeg中,作者使用RNN來檢索上下文信息作為分割基礎的壹部分。
卷積神經網絡在采樣時會丟失壹些細節,從而得到更多的特征值。但是,這個過程是不可逆的,有時會導致圖像分辨率低和後期操作時丟失細節等問題。因此,我們無法通過上采樣在壹定程度上補充某些缺失信息,從而得到更準確的分割邊界。
卷積後,執行上采樣以獲得片段圖。
優勢:
FCN在像素級對圖像進行分類,從而解決了語義級的圖像分割問題。
FCN可以接受任何大小的輸入圖像,並且可以保留原始輸入圖像中的空間信息。
缺點:
由於上采樣,獲得的結果是模糊和平滑的,並且對圖像中的細節不敏感;
單獨對每個像素進行分類沒有充分考慮像素之間的關系,並且缺乏空間壹致性。
在深度卷積神經網絡中恢復降低的分辨率,從而獲得更多的上下文信息。
DeepLab是壹種結合深度卷積神經網絡和概率圖模型的方法,應用於語義分割任務,目的是逐像素分類。其先進性體現在DenseCRFs(概率圖模型)和DCNN的結合上。將每個像素視為壹個CRF節點,利用遠程依賴和CRF推理直接優化DCNN的損失函數。
在圖像分割領域,FCN的壹個眾所周知的操作是先平滑後填充,即先卷起線條再匯集,以便在減小圖像尺寸的同時增加感受野,但在減小圖像尺寸(卷積)然後增加尺寸(上采樣)的過程中壹定會丟失壹些信息,因此這裏有改進的空間。
DeepLab提出了洞卷積來解決這個問題。
(1)
交叉熵損失
焦損失解決了困難和困難樣品的不平衡
②醫學圖像分割
骰子損失(這個損失函數有壹個背景,它直接優化了性能指標,並涉及我的另壹個主題,非凸優化)
借據(常用作評估指標)
在上述基本損失的基礎上,還有各種改進。
因為相鄰像素與相應感受野中的圖像信息過於相似,如果相鄰像素屬於所需分割區域的內部,則這種“相似性”是有益的,但如果相鄰像素正好在所需分割區域的邊界上,則這種“相似性”是有害的。
上下文特征很常見。事實上,上下文大概可以理解為圖像中的每個像素都不能孤立存在,壹個像素必須與其周圍的像素有壹定的關系。大量像素相互連接產生圖像中的各種對象,因此上下文特征是指像素與周圍像素之間的某種關系。
1.向網絡輸出的分段邊界添加額外損失,或者讓網絡分別建模和學習邊界的特征和區域內部的特征。其基本思想是讓網絡同時完成兩項任務:分割和邊緣檢測。此外,提高輸入圖像的輸入分辨率和中間層特征圖的分辨率也是簡單有效的。
2.在圖像的二維空間中使用損失或采樣的動態加權來解決同壹圖像中不同語義的像素數量不均勻和不同學習難度的問題。
3.使用半監督或弱監督學習來減少昂貴的標記問題。使用多個有噪聲的樣本或標簽特征來構造虛擬的幹凈的虛擬樣本或標簽特征以降低標簽噪聲。
4.使用合理的上下文建模機制幫助網絡猜測遮擋部分的語義信息。
5.在網絡中的不同圖像之間建立損失或特征交互模塊。