當前位置:成語大全網 - 漢語詞典 - 醫療大數據如何分類

醫療大數據如何分類

常見的分類方法包括監督分類和非監督分類。所謂監督分類,是指在結果已知的情況下,對樣本進行分類。監督分類本質上是樣本和結果之間的矩陣相關性分析,因為它可以同時指導樣本和數字結果的各種參數信息。

插圖:監督分類和非監督分類

監督分類和非監督分類

監督分類,也稱為訓練場方法,是壹種基於建立統計識別函數的技術和典型的樣本訓練方法。所謂典型樣本,就是最終歸屬已經知道的樣本。比如我們獲得了200名輕傷患者和200名重傷患者的各種數據,想通過統計識別功能判斷入院時輕傷和重傷的區別。這種分類稱為監督分類。因為此時已知400人的判決結果。我們可以通過各種泛函將樣本數據盡可能映射到結尾,有時還可以利用計算機的高速計算能力不斷修正函數結果。無監督分類就是利用計算機的計算能力,在結果出來之前,自動找出樣本之間的差異和聯系,看哪些成都可以被包含的變量分開。無監督分類包括主成分分析、層次聚類、Kmean聚類和基於SOM細胞自組裝的分類系統。