什么是數據可視化

2022-03-2622:01:57什么是數據可視化已關閉評論

數據可視化導論

以圖形方式表示數據或信息,以便觀察者能夠輕松理解數據趨勢的過程,這稱為數據可視化。使用任何視覺元素,以便從數據中理解和研究趨勢、異常值和模式。用于數據可視化的不同工具包括圖表、地圖和圖形等。這些工具的設計方式可以輕松理解和掌握數據提供的信息,而不是掃描excel表格的整個過程,從而為分析人員節省時間。

Hadoop、數據科學、統計和;其他

餅圖

使用中最普遍的圖表之一是披薩圖或餅圖。

混合物中氣體的比例
這張圖表通常在選舉中用來顯示哪個政黨獲得了最多的選票,盡管它非常受歡迎,但也有一些明顯的缺點。愛德華·塔夫特(Edward Tufte)、利蘭·威爾金森(Leland Wilkinson)和杰拉爾德·范貝爾(Gerald van Belle)等統計學家都表示不愿意使用餅圖。反對餅圖的最確鑿的證據可能是由Perceptive Edge的創始人斯蒂芬·諾爾(Stephen Now)提供的。斯蒂芬在《視覺商業智能通訊》上發表的文章《為甜點留餡餅》中解釋了為什么,令同事和學生驚訝的是,他認為餡餅圖是可視化數據的無效手段。
請看下面的餅圖。

在這張描繪晚上9點后訂購的食品比例的圖表中,很容易估算出屬于冰淇淋的百分比——25%。然而,經過輕微修改后,再也無法輕松確定冰淇淋訂單的百分比。

雖然冰淇淋的比例仍然保持在25%,但從上圖很難理解。在上一張圖中,很容易猜出百分比,因為冰淇淋的陰影從6點鐘位置開始,一直延伸到9點鐘位置。由于我們的眼睛經過訓練,可以看到12、3、6和9的時鐘,如果餅圖的區域與4個時鐘位置一致,那么它也更容易解釋。一位熱心的餅圖支持者會站出來建議,通過使用標簽和標記每個區域的百分比,可以很容易地避免這個問題。

帶有數據標簽的餅圖。
但同樣,為了將值映射到項目,我們的眼睛必須不斷將焦點從圖表底部的圖例轉移到圖表上的標簽上。

查看課程
相關課程
Hadoop培訓計劃(20門課程,14個以上項目,4個小測驗)
MapReduce培訓(2門課程,4個以上項目)
Splunk培訓計劃(4門課程,7個以上項目)
Apache Pig培訓(2門課程,4個以上項目)
解決這個問題的方法是附加項目名稱和值,以獲得類似的結果:

你會說,太好了。但我想問你——既然我們已經附上了項目名稱和價值,那么上面的餅圖與下表有什么不同:

使用按順序百分比排序的數據清理表。
這些信息看起來是否比散布在餅圖上的標簽和圖例要好得多。那么,餅圖有什么用呢?視覺化是為了增加價值;它們是結論的媒介;他們應該讓數據暴露其秘密。但在這種情況下,餅圖并沒有實現它的承諾。

進入數據可視化的條形圖

與餅圖相比,柱狀圖更簡潔、更優雅,它能夠表達餅圖上所說的一切,而不會弄亂標簽和圖例。

條形圖描述了相同的情況——易于比較、對比和總結
這與現在溫和地呈現給觀察者的信息相同。除了顯示個別價值外,這個圖表使我們能夠快速比較每種食物的受歡迎程度,甚至比較連續食物之間價值的相對差異。同樣的數據本可以通過表格獲得,但我們的大腦在處理圖像方面比破譯文本更好。
這就是為什么餅圖的使用隨著時間的推移而減少。雖然這是媒體行業最受歡迎的視覺效果,但它已經被更好、更復雜的表現形式所取代。除了折線圖、餅圖和條形圖之外,還有無數其他的圖表可以派上用場。一個有趣的圖是Sankey圖,但對新手來說并不流行。這個圖表用來表示物質的分布和流動。問題可能是能源、金錢,甚至是水。

典型IT員工的能量流和分布圖。
上面是一個虛構的Sankey圖,表示IT員工的大部分精力是如何以及在哪里分配的。

更新的工具

隨著社交媒體和人們可以寫出自己的感受、評論和觀點的不同平臺的出現,一個非常常見的數據可視化工具就是“云”。單詞云幫助我們了解人們在談論什么。

這是一個非常真實的、實時的word cloud,展示了google play商店中用戶對PUBG的評論。
如果我們看看這里的“云”這個詞,它是根據谷歌play store對游戲PUBG的前80條評論構建的,我們會發現對游戲的總體反應是“好的”,有些人甚至稱之為“最好的”然而,似乎有些“更新”存在問題,人們正在懇求游戲創作者予以糾正。事實上,當我們在那天查看play store的評論時,我們看到了同樣的情況。

更新的問題。另外,看看你是否能在這里找到“請”這個詞。

未來

這只是冰山一角。Plotly和D3等庫將數據可視化提升到了一個不同的水平。這是因為需求也發生了變化。你會如何在儀表盤上想象一個智能城市?一個巨大的屏幕,可以顯示整個城市的重要信息。
交通、電力使用、不同地區的健康狀況、空氣質量和許多其他參數需要顯示在一個頁面上。這一要求要求對數據可視化提出了一種不同的方法,因此我們通過這個概念了解了什么是數據可視化。我們不能再堅持使用圖表了。當圖形與藝術和想象力相結合,創造豐富的視覺體驗時,需要一種新穎的方法,這種討論需要一篇完全不同的文章。直到下次。

推薦文章

本文是關于什么是數據可視化的有用指南。在這里,我們用圖表和圖表討論了基本概念,以便您能夠輕松理解數據可視化。您還可以閱讀以下文章了解更多信息——

  1. Oracle數據庫管理員的職業生涯
  2. 7.數據挖掘和Web挖掘之間最有用的區別
  3. 數據分析面試問題
  4. 大數據分析示例