壹。主成分分析
主成分分析是壹種常用的數據降維方法。它通過線性變換將高維數據轉換為低維數據,並保留數據的主要信息。主成分分析的核心思想是將數據轉換到壹個新的坐標系中,以最大化新坐標系中數據的方差。
二、線性判別分析(LDA)
線性判別分析是壹種有監督的數據降維方法。與主成分分析不同,線性判別分析考慮類別信息。它通過線性變換將高維數據投影到低維空間中,最大化不同類別之間的距離,最小化同壹類別內的距離。線性判別分析可用於分類和可視化任務。
第三,t-SNE
T-SNE是壹種非線性數據降維方法。通過將高維數據映射到低維空間,使得低維空間中數據點的距離盡可能地反映高維空間中的相似性。T-SNE使用壹種特殊的概率分布來度量數據點之間的相似性,並使用梯度下降算法來最小化低維空間中的KL散度。
四。UMAP
UMAP是壹種新的非線性數據降維方法。通過將高維數據映射到低維空間,使得低維空間中數據點的距離盡可能地反映高維空間中的相似性。UMAP使用基於圖的方法來表示數據點之間的相似性,並且還考慮了數據點之間的局部結構和全局結構。
動詞 (verb的縮寫)自編碼器
自編碼器是壹種神經網絡模型,用於將高維數據編碼為低維表示。自編碼器由編碼器和解碼器組成。編碼器將高維數據映射到低維潛在空間,解碼器將潛在空間中的表示映射回高維空間。自編碼器可用於無監督學習和數據重建任務。
不及物動詞獨立成分分析
獨立成分分析是壹種無監督的數據降維方法。它假設高維數據可以由幾個獨立的信號源混合。獨立分量分析通過找到這些獨立的信號源來降低數據的維度。它可以用於信號處理和圖像處理任務。
七、非負矩陣分解(NMF)
非負矩陣分解是壹種常用的數據降維方法。它假設高維數據可以由幾個非負基向量線性組成。非負矩陣分解通過尋找這些基向量來降低數據的維度。它可以用於圖像處理和文本挖掘任務。
八、核主成分分析(KPCA)
核主成分分析是壹種非線性數據降維方法。它將高維數據映射到壹個高維特征空間中,然後在這個特征空間中進行主成分分析。核主成分分析可以用來處理非線性數據和非線性分類問題。