数据可视化:开篇(1)

数据可视化一直是一个有用却用常常被忽视的数据分析方法,本系列借助 gnuplot 或 Python 包介绍常见的图例展示方法。

文章来自微信公众号“科文路”,欢迎关注、互动。转载须注明出处。

上周四的文章介绍了平行坐标图(parallel coordinates plot),是我最近工作中很苦恼的一个问题的解答。

问题

我突然意识到,“数据可视化”似乎是一个常常被泛统计学学科忽视的训练内容,包括我自己,可能也没有重视、系统性的学习这个范畴。这就导致,在遇见看似整洁的数据面前,脑海里没有浮现正确的数据展示方案,比如:

  • 如何展示一组变量产生单一结果
    • $\Rightarrow$ 平行坐标图
  • 如何去展示大量“数据对”之间的差异?
  • 如何展示时间序列数据?

甚至,如何正确的叫出某一类图例的学名,以高效的和同事交流。这些,都可能需要系统的学习“数据可视化”。

工具

好马配好鞍。系统的学习不是纸上谈兵,高速发展的开源软件世界提供了边学边实践的可能:各种数据源、各种作图软件。

在“程序员+统计学者”的世界里,已经有了形形色色的作图工具。值得强调的是,无所不能的 C++ 标准库里缺少图形库,这使得使用 C++ 作图高效但笨拙。

此外,现有的一些工具常常被使用,

  • Python
    • Matplotlib、plotly、etc.
  • Tool
    • gnuplot、Octave、ExcelMATLAB
  • C++
    • qwt (Qt)

上述常用工具除了斜体的,其余个人都能免费获取和使用。

思路

接下来每周四,数据可视化系列将以 gnuplot 的功能为基础有序展开,并佐以每种图背后的统计学用途介绍,同时也将附赠 Python 代码。

最终,希望我们都能走向一个系统性学习的美好结局。

那就,下周四见~

~~

都看到这儿了,不如关注每日推送的“科文路”、互动起来~

至少点个赞再走吧~

数据可视化:开篇(1)

https://xlindo.com/kewenlu/posts/f7e80776/

Author

xlindo

Posted on

2024-04-25

Updated on

2024-04-25

Licensed under

Comments