當前位置:成語大全網 - 古籍善本 - 數據可視化分析的幾種表現形式。

數據可視化分析的幾種表現形式。

隨著互聯網的不斷發展,數據分析已經成為企業重要的運營方式之壹。今天,我們來看看數據可視化分析的常見類型。

數據可視化是數據科學家工作的重要組成部分。在項目的早期階段,您通常會進行探索性數據分析(EDA)來獲得對數據的壹些理解。創建可視化方法確實有助於讓事情變得更清晰、更容易理解,尤其是對於大型和高維數據集。在項目結束時,用清晰、簡潔、醒目的方式展示最終結果是非常重要的,因為妳的受眾往往是非技術客戶,只有這樣他們才能理解。

散點圖

散點圖非常適合顯示兩個變量之間的關系,因為可以直接看到數據的原始分布。如下圖所示,您還可以通過簡單的顏色編碼來查看不同數據組之間的關系。想要可視化三個變量之間的關系?沒問題!妳只需要使用另壹個參數,比如磅值,來編碼變量。

折線圖

當妳可以看到壹個變量隨著另壹個變量明顯變化時,例如,它們有壹個很大的協方差,使用折線圖是很好的。我們可以清楚地看到,隨著時間的推移,所有主線都發生了很多變化。把這些用零散的點畫出來會極其混亂,很難真正理解和看到發生了什麽。折線圖非常適合這種情況,因為它基本上為我們提供了兩個變量(百分比和時間)的協方差的快速匯總。此外,我們還可以通過顏色編碼進行分組。

柱狀圖

直方圖對於查看(或真正探索)數據點的分布非常有用。看看下面我們用頻率和智商做的直方圖。我們可以清楚地看到向中間聚集,我們可以看到中間值是多少。我們也可以看到它是正態分布的。使用直方圖確實可以清楚地顯示各組頻率之間的相對差異。使用組(離散化)確實有助於我們看到壹個“更宏觀的圖形”。但是,當我們使用沒有離散組的所有數據點時,可能會對可視化造成很大的幹擾,很難看到真正發生了什麽。

條形圖

當您試圖可視化具有少量類別(可能少於10)的分類數據時,直方圖非常有效。如果我們有太多的分類,那麽這些直方圖就會非常雜亂,難以理解。直方圖有利於對數據進行分類,因為妳可以很容易地看出基於列的類別之間的差異(比如大小);分類也容易分和色碼。我們將看到三種不同類型的條形圖:常規、分組和堆疊。

箱形圖

我們之前看了直方圖,直方圖很好的可視化了變量的分布。但是如果我們需要更多的信息呢?也許我們想更清楚地看到標準差?可能中位數和平均數差別很大,我們有很多離群值?如果有這樣的偏移,很多值都集中在壹邊怎麽辦?

這就是方框圖適合的。方框圖為我們提供了上述所有信息。北京電腦培訓認為,實心線框的底部和頂部永遠是壹個和三個四分位數(比如數據的25%和75%),框內的水平線永遠是兩個四分位數(中位數)。胡須狀的線條(虛線和末端的線條)從這個框中突出,顯示數據的範圍。