01.描述統計學
描述統計學是通過圖表或數學方法對數據進行整理和分析,對數據分布、數字特征和隨機變量之間的關系進行估計和描述的方法。描述性統計可分為三部分:集中趨勢分析、分散趨勢分析和相關分析。
集中式趨勢分析
集中趨勢分析主要依靠均值、中值、眾數等統計指標來表達數據的集中趨勢。比如,被試的平均分或多或少是正或負。
偏差趨勢分析
偏差趨勢分析主要依靠滿量程、四分位差、平均差、方差(協方差:用於衡量兩個隨機變量之間關系的統計量)、標準差等統計指標來研究數據的偏差趨勢。比如我們想知道兩個班的語文成績哪個更分散,就可以用兩個班四個點或者幾個百分點的差距來比較。
相關分析
相關性分析討論數據之間是否存在統計相關性。這種關系不僅包括兩個數據之間的單壹相關性,如年齡與個人領域空間的關系,還包括多個數據之間的多重相關性,如年齡、抑郁癥發病率與個人領域空間的關系。既包括A大B大(小)的線性相關,也包括復相關(A = Y-B * X)。可以是A和B變量同時增加這種正相關,也可以是A變量增加時B變量減少這種負相關,還包括兩個變量* * *隨變化的接近程度,即相關系數。
事實上,唯壹沒有研究的數據關系是數據共變的內在基礎,即因果關系。獲取相關系數有什麽用?簡而言之,有了相關系數,我們就可以根據回歸方程估計出從A到B的變量,這就是回歸分析。因此,相關性分析是壹種完整的統計研究方法,貫穿於假設、數據研究、數據分析和數據研究的始終。
例如,我們想知道監獄場景可以做哪些改變,以減少囚犯的暴力傾向。我們需要將不同的細胞色調、細胞綠化程度、細胞群體密度、戶外時間、探視時間進行排列組合,然後讓每個細胞進行壹次實驗性處理,再用因子分析找出與犯人暴力傾向相關系數最高的因子。假設這個因素就是細胞人口密度,我們將被試隨機分成十幾個人口密度不同的細胞,然後得到人口密度和暴力傾向兩組變量(即我們討論的變量A和B)。然後,我們把人口密度放入X軸,暴力傾向放入Y軸,得到了壹個有價值的圖表。當壹個典獄長想知道壹個牢房擴大到N人/牢房,暴力傾向能降低多少。我們可以把當前的人口密度和重建的人口密度帶入相應的回歸方程,計算出擴張前和擴張後的預期暴力傾向。兩個數據的差異就是典獄長想知道的結果。