数据可视化一直是一个有用却常常被忽视的数据分析方法,本系列借助 gnuplot 或 Python 包以工程师视角介绍常见的图例展示方法。数据可视化:常见统计量(4,略进阶)(附 python 代码)
文章来自微信公众号“科文路”,欢迎关注、互动。转载须注明出处。
前面的章节里,我们从“统计量”(statistic)起步。
这一节先接着说一下其余的常见统计量以及两个常用的概率分布,至此就结束了基础知识背景的回顾。其实这方面的内容还有很多,但局限于时间、精力,如果后续“可视化”的章节里有涉及,我们再补充。
这篇写的好累,如果你觉得有用还是点个赞吧。
1. 术语表(更新)
中文 | 英文 | 常用符号 | $\LaTeX$ |
---|---|---|---|
均值 | mean | $\mu$, $\bar{x}$ | \mu , \bar{x} |
中位数 | median | $\text{med}$ | \text{med} |
众数 | mode | $\text{mode}$ | \text{mode} |
方差 | variance | $\sigma^2$ | \sigma^2 |
标准差 | standard deviation | $\sigma$ | \sigma |
最大值 | maximum | $\max$ | \max |
最小值 | minimum | $\min$ | \min |
分位数 | quantile | $Q$ | |
矩 | Moment | $\mu_{n}$ | \mu_{n} |
偏度 | skewness | ||
峰度 | kurtosis | $\operatorname {Kurt}[X]$ | |
正态分布 | normal distribution | ${X\ \sim \mathcal {N}}(\mu ,\sigma ^{2})$ | |
卡方分布 | $\chi^2$-distribution | $Q\ \sim \ \chi ^{2}(k)$ |