1.?數據:定義和目標
首先要明確壹些定義。
數據:用於展示和解釋收集、分析和提煉的事實和數字;
變量:可以取不同值的符號或指示器。如:行業、股價、市值;
決策變量:變量的值由決策者直接控制;
隨機變量/不確定變量:變量的值不受決策者直接控制的因素影響,可能存在不確定性波動;
觀察值/觀測值:對應壹組變量的壹組值;
描述性分析,即通過對收集的數據進行分析,以獲得對變異及其對業務環境的影響的良好理解。
2.?數據類型
(1)總體數據和樣本數據:在許多情況下,從總體(感興趣的元素的集合)中搜索數據是不可行的。此時,可以從人群的子集(樣本)中收集數據。尋找能代表總體的樣本數據是非常重要的。只有這樣,那些樣本數據才能擴展到對整體情況的了解。
(2)數量數據和屬性數據:數量數據是指能夠進行加減乘除等數值和算術運算的數據,比如壹家公司的市值;屬性數據是指那些不能進行算術運算的數據。對這些數據進行描述性分析,只能統計或計算觀察值在各個類別中所占的比例,比如公司所屬的行業。
(3)橫截面數據和時間序列數據:橫截面數據是指同時或幾乎同時采集的部分個體的數據;時間序列數據:指幾個時期的數據。時間序列數據圖可以幫助分析師了解過去發生的事情,識別隨時間變化的趨勢,並預測未來。