迄今為止,我大約也幫忙做了能有上千份的學生論文數據分析部分,包括壹部分的整篇論文寫作。因為我是做市場研究與數據分析的,擅長的主要工具是spss,不敢說百分百精通spss,但是應付個八九十應該是足夠了,很自然的平時就利用下班和業余時間幫學生做壹些論文數據分析以及論文寫作指導。
很多論文的核心部分都包括數據分析,而統計學也應該是所有學科應該學習的壹門重要課程,但是恰恰相反,很多學科只是把統計學和數據分析作為壹項選修甚至不重要的課程對待,這樣導致學生在最後做論文時完全不懂。
而在這種情況下,很多學生因為對數據分析的壹竅不通,導致論文從開始的設計到後續的數據收集、整理等都會出現問題,最終導致分析出問題。
因此,在對數據分析壹竅不通的情況下,應該如何從頭構建論文及寫作呢?很多論文雖然數據分析部分是核心,但是不管哪種論文的寫作,都脫離不了論文的框架。因此,具體的過程應該如下:
首先是選題,當然很多時候是導師直接給選題,這個沒有太多討論。
其次是選題確定後,馬上要做的不是想我應該怎麽去寫作,或者在哪抱怨“哎~~郁悶,完全不知道怎麽寫嘛”。而是先通過文獻查找,看前人在這個選題方面已經做了哪些研究,都是如何做的。通過查找文獻找到跟選題有關的資料,然後對這些資料進行整理,整理不需要計較參考文獻的結論和數據細節等,而是要把每篇文獻的研究目的、采用的研究方法、采用的分析方法整理出來。當然參考文獻中的分析方法妳可能還完全不懂,但是沒關系,妳先把這些參考文獻中使用的分析方法全部羅列出來,如線性回歸、方差分析、均值t檢驗、logistic回歸等,把這些文獻中常用的統計方法羅列出來,妳需要弄清楚對應關系,即每種分析方法是用來支持和實現什麽樣的研究目的,以及能夠得出什麽樣的結論,認真閱讀文獻就能實現這壹步。
第三.通過上壹步,妳應該朦朧的知道妳選題相關的參考文獻中常用的統計方法名稱,以及這些統計方法能夠幫助實現哪些目的,或者得出什麽結論,同時也不會對自己的選題那麽恐懼和迷茫了,因為可能妳的選題已經有前人做過了,妳的論文只是“復制”壹遍而已了,我說的復制是重復壹遍前人的研究。在這種情況下,可以構思下自己的選題,這壹步屬於純理論層面的,妳需要將自己的思路具體化,比如要實現什麽目的,很自然的需要什麽數據分析方法也就能確定了。當然很多論文會預先設計壹系列待驗證的假設,也是在這壹步完成,因為妳找到的文獻中可能會存在矛盾的結論,可能會存在壹些妳認為的研究缺陷(文獻看多了,自然自己就會有想法出來了),提出自己的壹系列假設,能夠很清楚的指導後面的數據收集和分析。
第四.選題、假設還有研究方法這些經過前面幾步都能確定了,接下來就是要考慮具體研究和收集數據的環節了。這個環節最重要的也是首要的是弄清楚妳的數據應該是什麽類型的,通過哪種方法來獲取。其實也容易了,因為前面妳已經確定了統計分析方法,而每種方法有它特定的數據類型要求,比如是分類數據(如性別、民族、年級等)、比如連續性數據(如年齡、身高、體重、溫度、長度、距離等)。分類數據簡單通俗點的理解就是這些數字本身是沒有意義的,是人為賦予它壹定的含義,這些數據之間不存在連續性,且加減乘除沒有意義,而連續性數據是數據本身有意義,且能夠進行壹些加減乘除運算。確定了所需要的數據類型,就大致能夠知道在數據收集時,應該註意的問題。比如壹份問卷調查,其中應該如何設計問題也就大致清楚了,通常問卷設計時就要考慮兩種數據類型的問題,因為不同的選項設計會導致不同的數據類型。如妳設計壹個問題的答案選項是“有/沒有”、“是/否”這種是屬於分類數據,如果妳的答案選項是李克特量表式“非常滿意----非常不滿意”這種,在處理時可以按照分類數據,只能統計出壹些百分比,也可能將其按照連續數據如12345打分形式,這樣可以求均值,可以做很多其他多元統計分析。因此這壹步確定數據類型很關鍵,如果數據類型弄錯的話,則收集的數據完全無用。
第五.具體收集數據過程,不細說了,收集回來之後 就是數據的錄入。記住壹定要錄入原始的數據,而不是經過加減整理匯總後的數據。數據錄入格式也是有要求的,壹般大致同樣的情況下,都是壹行代表壹個個案或者壹份問卷的數據,而壹列對應表示的是問卷中的壹個問題,即變量。因此數據錄入完成後,應該是有多少樣本數據,就有多少行,數據中包含多少個指標,那就有多少列。
第六.這壹步才是妳應該開始頭疼的數據分析不會了怎麽辦。因為到這裏才開始是數據的具體分析過程了。不會怎麽辦,前面已經知道了分析方法,這種情況,只有找本教材,然後找對應的方法介紹學習即可,或者實在不行找人指導,找人幫忙等等。
最後。分析完成後,開始整篇論文的寫作。
PS:還要強調壹點,現在的高校導師都存在壹些問題,因為我接觸了那麽多學生,他們的認為觀點就是“我的統計檢驗結果不顯著怎麽辦,那不就是說我的研究沒有意義麽?我的假設都是錯的?”“我的結論跟前人的結果不壹致啊,看來我的又錯了”,這兩種觀點明顯是錯的:
壹、數據的來源對象發生了變化,誰規定的結論必須跟前人壹致;
二、請問愛迪生發明燈泡的前999次失敗是沒有意義麽?科學研究本來就是壹個證偽的過程,壹次次證偽來接近真相。
三、如果妳的假設壹定是正確的,那不需要數據驗證,妳可以去幫助警察破案了,因為妳認為妳的假設壹定是對的,那破案多簡單的,假設壹下就好了。但是很顯然,很多導師並沒有把這些正確的觀點傳達給學生。