醫學統計學基礎概念整理2017
統計學是研究數據的收集、整理和分析的壹門科學。其工作流程為設計、搜集、整理、分析與結果報告。打個通俗的比喻,統計學就好比?打牌?,抓牌就是搜集數據,牌抓好後要整理壹下,然後研究怎麽打就是分析,打的輸贏就是結果報告。下面是我為大家帶來的關於醫學統計學基礎概念整理的知識,歡迎閱讀。
壹.總體與樣本
總體:是指根據研究目的所確定的觀察單位某項特征的集合。比如說我想研究山西醫科大學所有在校生的平均體重,那根據此目的,我們研究的總體就是:山西醫科大學所有在校生的體重數據的集合。但是需要註明壹點:總體分為有限總體和無限總體,上面的例子就是有限總體,畢竟山西醫科大學學生還是有限的,然而科研過程中面臨的大多數是無限的總體,我們是無法取得其總體進行研究的。那我們面對無限總體怎麽辦呢?
我們為了研究無限總體,發明了抽樣的方法。就像我們想知道壹鍋老母雞湯的鹹淡,不需要喝完所有的湯,只要搖勻,嘗其壹勺就可以了,這種思想就叫?抽樣?。
樣本:就是從總體中抽出的部分觀察單位某項特征的集合。但是在抽樣過程中必須遵守隨機化的原則。
隨機化原則:是指總體中的任何壹個觀察單位都要有同等的機會被抽到作為樣本進行研究。那麽如何保證隨機化抽樣呢,壹般包括單純隨機抽樣、系統抽樣、分層抽樣、整群抽樣和多級抽樣等方法。
二.參數與統計量
參數:用於描述總體特征的指標;
統計量:用於描述樣本特征的指標;
總體、樣本、參數與統計量的關系如下圖。
統計學就是通過描述樣本的統計量去推斷描述總體的參數。這是通過偶然去發現必然的過程,通過壹般去發現普遍的過程,是以小見大的過程。
三.誤差
誤差:觀察值與真知之差。即我們通過壹次試驗得到的結果與事件真實結果之間的差值。誤差根據其產生的原因,分為四種:
(1)系統誤差:因為試劑未校正或儀器沒有調零等因素造成的研究結果傾向性的增大或減小。如我們路過藥房,門口放個壹個體重計,請問我們在稱自己的體重之前,首先要幹的第壹件事情是什麽呢?從統計學角度,我們應該看看體重計上的指針是不是對準零,如果本身就有5Kg底重,那我們所有的同學去稱,都將會重5Kg,即發生傾向性的偏大。其特點:傾向性的增大或減小,如果我們就行調零,就可以避免。
(2)隨機誤差(random error):是由各種偶然因素造成的觀察值與真值之差。比如班級所有同學用同壹把尺子測量我的身高,結果發現我的身高值是不壹樣的。其特點為:不可以避免,但可以減少。統計學有壹定律叫做?測不準定律?,不管妳怎麽測,就是測不準,因此我們通常多次測量後取平均。
(3)抽樣誤差(sampling error):因為抽樣造成的樣本統計量與總體參數之間的差異。有人會說,剛才那壹勺老母雞湯的鹹淡應該和鍋裏湯的鹹淡是完全壹樣的啊,是的,但上面的例子是在講抽樣的原理,而我們科學研究和喝老母雞湯是不壹樣的,因為湯裏的氯化鈉是均勻分布的,而我們科學研究的目標事件是不均勻分布的。比如某個班級120名同學的近視眼患病率為50%,我按照隨機化原則隨機抽取50名同學,則50名同學的近視眼患病率絕對不等於50%,因為近視眼同學在班級中的`分布是不均勻的。因此抽樣誤差的特點為:不可以避免,但可以減少。我們可以通過增大樣本量進行減少。
(4)過失誤差(gross error):
由於觀察過程中的不仔細造成的錯誤判斷或記錄。過失誤差可以通過仔細核對進行避免。
那我們統計學的存在主要是解決那種誤差呢?我們通過統計設計減少系統誤差、通過統計學檢驗去排除抽樣誤差的。
四.概率與頻率
概率(P):用於反映某壹事物發生可能性大小的壹種量度。壹般用大寫的斜體P表示。
我們根據事物發生概率的大小,把事件分為3類:P=1為必然事件,發生率為100%;P=0為不可能事件,發生率為0;0
頻率(f):是指我們進行了N次試驗,其中壹個事件出現的次數m與總的試驗次數N的比值。
問題是:我們到底如何能夠得到某壹事件發生的概率呢,比如說誰能夠告訴我壹個半截粉筆從講臺上掉下摔斷的概率P=?。我們至今的科學發展也沒有辦法通過公式去計算該值。那我們是怎麽做的呢?有句話叫做?有些事情越想越煩,做起來卻極其簡單?。我們只需要那兩盒同樣的粉筆進行重復摔就可以了,如果總***100支粉筆,斷了98只,那斷的頻率就等於f=98/100=0.98。而統計學上證實,當某事件發生次數較多時,頻率就會接近於概率。意即f=P。因此,其實我們就是通過頻率去估計概率的。
五.同質與變異
同質:是指觀察單位所受的影響因素相同。而我們科研的觀察單位所受的影響因素只可能相對的相同,不可能絕對的相同,因此,同質是相對的。
變異:是指觀察單位在同質的基礎上的個體差異。天底下沒有兩個完全壹樣的事物,唯壹不變的就是變化。因此,變異是絕對的。
這壹對概念對我們研究統計的意義:如果沒有同質的話,就沒有我們研究的總體或者樣本。因為如果不同質,我們是不可能把他們放在壹起進行研究的。如果沒有變異,就根本沒有統計學產生的必要,因為如果沒有變異,我們拿壹種藥物治療某病的壹個病人,如果有效,該藥對所有該病病人都應該有效,這是不可能的。
六.試驗vs實驗
試驗?對已知事物結果的探索過程:為了查看某事的結果或某物的性能而從事某種活動。
實驗?已有明確的結論/假說後的驗證過程:為了檢驗某種科學理論或假設而進行某種操作或從事某種活動。
從上述來自《現代漢語詞典》的兩個解釋,可以看出:實驗中被檢驗的是某種科學理論或假設,通過實踐操作來進行;而試驗中用來檢驗的是已經存在的事物,是為了察看某事的結果或某物的性能,通過使用、試用來進行。
在我們實際應用中,很多詞匯中到底是用?試驗?還是?實驗?是已經根據前人的經驗明確了的。比如RCT(Randomized Controlled Trial),我們會叫?隨機對照試驗?,我想多半是因為翻譯的過程中Trial翻譯為?試驗?更為合適。而RCT中,患者被分為兩組時,則被稱為?實驗組?(Treatment Group)和對照組(Control Group)。
七.病人/患者vs受試者/研究對象
這兩組詞,也許沒有必要把定義在貼上來了,因為他們的區別顯而易見。病人/患者的稱法,當然應該用於病人和患者的身上。如果研究是在健康人或者潛在患者人群中開展的,此時研究對象還不能確定為病人/患者,那麽只能稱其為受試者或研究對象。相似的,在產科的研究中,如果研究對象為壹般的產婦,我們通常也不應該用?患者?或?病人?這樣的稱謂。
研究對象可以說是壹個萬金油,什麽時候用都是可以的。而受試者我們又要說壹下了,?受試者?常與某種幹預聯系在壹起,通常僅在幹預性研究(RCT、類實驗)和診斷試驗中才會使用。
八.終點vs結局
結局(Outcome)?研究中患者可能出現的壹種結果:某種疾病或某種狀態影響下的(人的)最終(健康)狀態。
終點(Endpoint)?研究中患者某壹結果的替代指標:用於在研究中判斷幹預或因素作用效果的某種?結局?。
在臨床研究中,結局通常是指患者的某種轉歸,比如腫瘤患者中,痊愈、死亡、復發、轉移這些都可以作為結局。當然,幹預或某種因素暴露下短期的改變也可以成為結局,比如紅細胞的升高、體溫降低等等。而終點,則是臨床研究中的效應評價點,比如主要終點、次要終點,此時用?結局?就不合適了。
上面這些看起來很頭疼吧,那就記個最簡單的。壹般在試驗性研究中(比如在RCT)我們壹般使用?終點?,生存分析是有時也會用觀察終點這壹說法;而在其他類型的研究中,常使用?結局?。
九.排除vs剔除
所謂的排除標準就是考慮到研究的可行性和研究對象的安全,將壹部分無法保證研究對象安全及不可行的符合入選條件的研究對象排除在研究之外。針對研究對象開始進行研究前,不將符合排除標準的對象作為研究對象納入,這就是排除。
在臨床研究中,根據入選排除標準確定研究對象之後,在研究中我們還會發現壹些患者無法接受進壹步幹預或觀察,或者在研究期間才能發現研究對象的某些特征不屬於我們將要外推的範圍。此時雖然這些對象在研究初期被確定為?研究對象?,認為他們屬於研究結果將要外推到的人群,但實際上他們並不屬於該類人群。這時我們就要將該類研究對象?剔除?出研究,相應的標準就是剔除標準。
簡而言之,排除是在研究初期用於選擇研究對象的;剔除是在研究中期用於去除隨時發現的非外推人群的研究對象。
;