搜索
查看: 3054|回复: 1

全基因组分窗口统计GC含量

[复制链接]

634

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
发表于 2017-1-26 23:27:06 | 显示全部楼层 |阅读模式
首先需要下载基因组序列
然后确定自己的窗口,比如1k,10k,等等
脚本很简单,需要得到如下数据(取部分示例):
[AppleScript] 纯文本查看 复制代码
> head(GCcontent)
        chr interval1 interval2     GC
103825 chr1         1     10000 0.0000
103826 chr1     10001     20000 0.5923
103827 chr1     20001     30000 0.5174
103828 chr1     30001     40000 0.4712
103829 chr1     40001     50000 0.3561
103830 chr1     50001     60000 0.3654


其实有现成R包,或者现成的数据下载,但是这个练习题做出来了,你能更加理解原理!
https://rdrr.io/bioc/SomatiCA/man/GCcontent.html
https://rdrr.io/bioc/SomatiCA/man/GCcount.html
其实在R里面没必要去diretory of human genome assembly. e.g."http://hgdownload.soe.ucsc.edu/goldenPath/hg19/chromosomes/".里面下载基因组,直接加上BS.genome系列包即可,我 就不多说了。
你们自己好好练习吧!





上一篇:【直播】我的基因组(六):变异位点注释数据库的准备
下一篇:生信编程直播第六题:批量根据基因list来提取信息(shell)
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复

使用道具 举报

2

主题

16

帖子

147

积分

注册会员

Rank: 2

积分
147
发表于 2017-12-26 10:40:52 | 显示全部楼层
GC含量一般可以用来做什么分析呢
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-9-16 15:43 , Processed in 0.050737 second(s), 25 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.