数据可视化:开篇(1)
数据可视化一直是一个有用却用常常被忽视的数据分析方法,本系列借助 gnuplot 或 Python 包介绍常见的图例展示方法。
文章来自微信公众号“科文路”,欢迎关注、互动。转载须注明出处。
上周四的文章介绍了平行坐标图(parallel coordinates plot),是我最近工作中很苦恼的一个问题的解答。
问题
我突然意识到,“数据可视化”似乎是一个常常被泛统计学学科忽视的训练内容,包括我自己,可能也没有重视、系统性的学习这个范畴。这就导致,在遇见看似整洁的数据面前,脑海里没有浮现正确的数据展示方案,比如:
- 如何展示一组变量产生单一结果
- $\Rightarrow$ 平行坐标图
- 如何去展示大量“数据对”之间的差异?
- 如何展示时间序列数据?
甚至,如何正确的叫出某一类图例的学名,以高效的和同事交流。这些,都可能需要系统的学习“数据可视化”。
工具
好马配好鞍。系统的学习不是纸上谈兵,高速发展的开源软件世界提供了边学边实践的可能:各种数据源、各种作图软件。
在“程序员+统计学者”的世界里,已经有了形形色色的作图工具。值得强调的是,无所不能的 C++ 标准库里缺少图形库,这使得使用 C++ 作图高效但笨拙。
此外,现有的一些工具常常被使用,
- Python
- Matplotlib、plotly、etc.
- Tool
- gnuplot、Octave、Excel、MATLAB
- C++
- qwt (Qt)
上述常用工具除了斜体的,其余个人都能免费获取和使用。
思路
接下来每周四,数据可视化系列将以 gnuplot 的功能为基础有序展开,并佐以每种图背后的统计学用途介绍,同时也将附赠 Python 代码。
最终,希望我们都能走向一个系统性学习的美好结局。
那就,下周四见~
~~
都看到这儿了,不如关注每日推送的“科文路”、互动起来~
至少点个赞再走吧~
数据可视化:开篇(1)