数据可视化:常见统计量(4,略进阶)(附python代码)

数据可视化一直是一个有用却常常被忽视的数据分析方法,本系列借助 gnuplot 或 Python 包以工程师视角介绍常见的图例展示方法。数据可视化:常见统计量(4,略进阶)(附 python 代码)

文章来自微信公众号“科文路”,欢迎关注、互动。转载须注明出处。

前面的章节里,我们从“统计量”(statistic)起步

这一节先接着说一下其余的常见统计量以及两个常用的概率分布,至此就结束了基础知识背景的回顾。其实这方面的内容还有很多,但局限于时间、精力,如果后续“可视化”的章节里有涉及,我们再补充。

这篇写的好累,如果你觉得有用还是点个赞吧。

1. 术语表(更新)

中文 英文 常用符号 $\LaTeX$
均值 mean $\mu$, $\bar{x}$ \mu, \bar{x}
中位数 median $\text{med}$ \text{med}
众数 mode $\text{mode}$ \text{mode}
方差 variance $\sigma^2$ \sigma^2
标准差 standard deviation $\sigma$ \sigma
最大值 maximum $\max$ \max
最小值 minimum $\min$ \min
分位数 quantile $Q$
Moment $\mu_{n}$ \mu_{n}
偏度 skewness
峰度 kurtosis $\operatorname {Kurt}[X]$
正态分布 normal distribution ${X\ \sim \mathcal {N}}(\mu ,\sigma ^{2})$
卡方分布 $\chi^2$-distribution $Q\ \sim \ \chi ^{2}(k)$
Read more

数据可视化:常见统计量(3)(附python代码)

数据可视化一直是一个有用却又常常被忽视的数据分析方法,本系列借助 gnuplot 或 Python 包以工程师视角介绍常见的图例展示方法。数据可视化:常见统计量(2)(附 python 代码)

文章来自微信公众号“科文路”,欢迎关注、互动。转载须注明出处。

上一节,我们从“统计量”(statistic)起步。这一节先回顾一下一些常见的统计量。

1. 术语表

中文 英文 常用符号 $\LaTeX$
均值 mean $\mu$, $\bar{x}$ \mu, \bar{x}
中位数 median $\text{med}$ \text{med}
众数 mode $\text{mode}$ \text{mode}
期望值 expectation $\operatorname {E}$ \operatorname {E}
方差 variance $\sigma^2$ \sigma^2
标准差 standard deviation $\sigma$ \sigma
最大值 maximum $\max$ \max
最小值 minimum $\min$ \min
Read more

数据可视化:统计量(2)

数据可视化一直是一个有用却用常常被忽视的数据分析方法,本系列借助 gnuplot 或 Python 包介绍常见的图例展示方法。数据可视化:统计量(2)

文章来自微信公众号“科文路”,欢迎关注、互动。转载须注明出处。

我们将从一些统计学相关的概念起步,以确保各位读者在基础知识方面有一个合格的起点。道理其实很简单——之所以使用“数据可视化”,那必然是因为从原始数据上很难发现差异或者规律,但我们至少要能知道如何在原始数据上进行研究。

所以,我们从“统计量”(statistic)起步。

插一句,英文的 statistic 这个术语有点拗口,它既可以表示用来计算统计量的函数,例如 do a statistic on something;也可以表示计算的结果,也就是这里的统计量。

Read more

数据可视化:开篇(1)

数据可视化一直是一个有用却用常常被忽视的数据分析方法,本系列借助 gnuplot 或 Python 包介绍常见的图例展示方法。

文章来自微信公众号“科文路”,欢迎关注、互动。转载须注明出处。

上周四的文章介绍了平行坐标图(parallel coordinates plot),是我最近工作中很苦恼的一个问题的解答。

Read more