搜索
查看: 693|回复: 0

StaQuest第一讲

[复制链接]

5

主题

7

帖子

92

积分

注册会员

Rank: 2

积分
92
发表于 2018-9-11 10:41:12 | 显示全部楼层 |阅读模式
认识柱状图
​         在生物信息领域,我们常常需要对各种各样的数据进行统计分析,而数据分布的特征往往是我们最容易忽视而又必不可少的。而要了解一个数据分布的特征,我们可以通过各种各样的方法,一个比较直观的方法,就是绘制柱状图,下面就来带大家简要的了解下柱状图。
​         用一个小例子说明:假如我们对一群人的身高进行测定,这群人的身高参差不齐,测量结果如下图所示:
​         我们可以看到,上图中有许多点由于过于集中而被遮掩住了,为了能更好的呈现出数据的结构,因此我们在上图的基础上,按照一定的方式将数据分成了有限个bins,如下图所示:
​          然后我们对区间内的点进行统计, 这就是我们所说的柱状图:
​        通过柱状图,我们可以清晰的看到数据的分布,是不是很直观呢?
Note:一个合理的bin的范围是非常重要的。
​      假如我们划分的bin的区间非常小,得到的图可能就是这样了:
​     同理假如我们划分的bin的区间非常大的话,可能会得到下面的图:
​        很明显过大或过小的bin的取值都不能很好的展现出数据结构,因此我们在绘图的时候,有时候不能过分依赖默认值,有是需要我们自己进行多次调试才能得到最合适的结果。






上一篇:小洁详解《R数据科学》--第三章dplyr
下一篇:StaQuest正态分布
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-10-14 22:12 , Processed in 0.043065 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.