V-Net是3D U-Net的另壹個版本。它和U-Net的區別是:?1,3D圖像分割end2ent模型(基於3D卷積),用於MRI前列腺體積醫學圖像分割。2.新的目標函數基於Dice系數。3.數據擴展方法:隨機非線性變換和直方圖匹配。4.加入殘差學習,提高收斂性。
(1)網絡結構
其網絡結構的主要特點是三維卷積,並介紹了剩余模和U-Net框架。網絡結構如下所示:
全網分為壓縮路徑和非壓縮路徑,即特征圖縮小和擴大,每級縮小壹半特征,即通道上的128-128-64-32-16-8,1-16-32-64-8。殘差學習被添加到每個階段以加速收斂。
圖中圓圈加十字表示卷積核為5*5*5,步距為1的卷積。可以看出,當填充為2*2*2時,特征尺寸可以保持不變。在每壹階段結束時,使用卷積核為2*2*2、步距為2的卷積,特征大小減少壹半(2x2 max-pooling由2xconv代替。).整個網絡采用keiming等人提出的PReLU非線性單元,在網絡末端加上壹個1*1*1的卷積,處理成與輸入大小相同的數據,然後用壹個softmax連接起來。
(2)損失函數
因為前景比較小,在學習過程中不容易被學習,所以重新定義了Dice系數損失函數。兩個二元矩陣的骰子相似系數為:
使用該功能可以避免類別失衡。?