搜索
查看: 5134|回复: 15

[mRNA-seq] 震惊!NCBI上就有RNA比对的protocol!

[复制链接]

3

主题

34

帖子

310

积分

中级会员

Rank: 3Rank: 3

积分
310
发表于 2017-3-7 20:58:52 | 显示全部楼层 |阅读模式
众里寻他千百度 接下来就是慢慢啃了https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4631051/




上一篇:BioNet寻找 maximal-scoring subgraph
下一篇:DESeq2
回复

使用道具 举报

3

主题

34

帖子

310

积分

中级会员

Rank: 3Rank: 3

积分
310
 楼主| 发表于 2017-3-17 10:48:31 | 显示全部楼层
本帖最后由 hxoxh 于 2017-3-21 09:23 编辑

将deseq2.xls另存为csv格式

http://asia.ensembl.org/biomart/ ... 5d899ef849b95bb698d下载基因的注释文件,下载格式为csv,命名为annotation.csv。

annotation.csv在“excel-数据-自文本”选项中导入,去除逗号分隔符。清除重复单元格,变成易于阅读的形式。


annotation.csv

deseq2.csv


发现deseq2.csv 和annotation.csv并不是完全匹配的,有个别的基因编号只在其中一个文件中存在。
但是不太妨碍得到表达差异的基因。
这部分最好还是通过python或者R代码完美的完成,
正在学习中

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 支持 1 反对 0

使用道具 举报

3

主题

34

帖子

310

积分

中级会员

Rank: 3Rank: 3

积分
310
 楼主| 发表于 2017-3-8 09:55:44 | 显示全部楼层
本帖最后由 hxoxh 于 2017-3-8 11:31 编辑

程序正在跑 等得好着急啊
第一次用到底会怎样                                                                                                                                                     

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 支持 反对

使用道具 举报

3

主题

34

帖子

310

积分

中级会员

Rank: 3Rank: 3

积分
310
 楼主| 发表于 2017-3-8 09:57:53 | 显示全部楼层
作为linux小白我想问一下
这个时候我不能输入别的命令了吗  只能干等着?
如果我想输入别的命令该怎么办呢  不能是ctrl+c吧
回复 支持 反对

使用道具 举报

3

主题

34

帖子

310

积分

中级会员

Rank: 3Rank: 3

积分
310
 楼主| 发表于 2017-3-8 10:01:31 | 显示全部楼层
其实最开始我犯了个错误  导致程序总是报错
因为我没有输入每一行最后的转义符号
~/star/code/STAR-STAR_2.4.0k/bin/Linux_x86_64/STAR \
--runThreadN 12 --runMode genomeGenerate --genomeDir ./ \
--genomeFastaFiles ./Homo_sapiens.GRCh38.dna.primary_assembly.fa
回复 支持 反对

使用道具 举报

3

主题

34

帖子

310

积分

中级会员

Rank: 3Rank: 3

积分
310
 楼主| 发表于 2017-3-8 11:15:38 | 显示全部楼层
本帖最后由 hxoxh 于 2017-3-8 11:32 编辑

第一步成功了                                                                                                                                                      


然后得到下图。目前我的操作都在基因组目录下,得到的这些文件自然也在这下面。我看不懂这些文件什么意思


不过也不妨碍我接下来继续做,STAR最终目的应该是得到一个sam文件。
测序公司给的是一个.clean.fastq的文件,还有个.fastq文件,文件名一样,只是扩展名不一样。我琢磨着clean一点当然好。就只是上传了clean的文件。
可是下一步报错了,说是read前缀不对。难道是文件格式的问题?我先RTFM一会儿。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 支持 反对

使用道具 举报

3

主题

34

帖子

310

积分

中级会员

Rank: 3Rank: 3

积分
310
 楼主| 发表于 2017-3-8 12:02:02 | 显示全部楼层
小木虫上有人说raw reads就是测序完后的原始序列,而cleanreads是去除接头以及一些质量值较低的reads后产生的。
应该区别不大。

回复 支持 反对

使用道具 举报

3

主题

34

帖子

310

积分

中级会员

Rank: 3Rank: 3

积分
310
 楼主| 发表于 2017-3-8 12:16:35 | 显示全部楼层

换用最开始的 basic protocol再跑一遍试试
这次新建了一个叫genome的目录,在这下面运行
把原来Danio_genome目录下的GCF_000002035.5_GRCz10_genomic.fna移动到genome下了

说到这个GCF_000002035.5_GRCz10_genomic.fna文件,其实是很早以前师姐做分析留下的。印象中好像是基因组文件。在我第一个帖子中已经在Danio_genome目录下稀里糊涂的再生成了一次基因组。所以把这个fna文件移动走也没有什么关系。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 支持 反对

使用道具 举报

3

主题

34

帖子

310

积分

中级会员

Rank: 3Rank: 3

积分
310
 楼主| 发表于 2017-3-8 13:07:36 | 显示全部楼层
本帖最后由 hxoxh 于 2017-3-8 13:09 编辑

成了。得到一个sam格式的文件。但是这次比对是把测得的野生型转录组和参考基因组比对
我们还测了突变体的转录组,最终要比较两者的基因表达差异。
是不是还要照着刚刚的方法跑一遍突变体的测序结果呢?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 支持 反对

使用道具 举报

3

主题

34

帖子

310

积分

中级会员

Rank: 3Rank: 3

积分
310
 楼主| 发表于 2017-3-8 14:10:18 | 显示全部楼层
查了一下 貌似真是这样 得跑一遍野生型然后跑一遍突变体,然后比较RPKM值
RPKM,Reads Per Kilobase of exon model per Million mapped reads [Mortazavi etal., 2008]:
每1百万个map上的reads中map到外显子的每1K个碱基上的reads个数。
还有个词叫FPKM(fragments Per Kilobase of exon model per Million mapped reads),差不多同义。

1.先用samtools把那个很大的sam转换成bam文件
2.再用htseq-count统计WT和MT的RPKM。
cufflink也有同样的功能?但是不知道我们服务器上有没有这个,不知道安装需不需要权限。
3.最后用DEGseq获得两者的q-value
开始吧。

ps:不知道linux系统能不能把这些命令一次全部输入完然后等过夜看结果
这样子一步一步地做有点儿麻烦 但是对我来说先这样子一步步来吧
回复 支持 反对

使用道具 举报

3

主题

34

帖子

310

积分

中级会员

Rank: 3Rank: 3

积分
310
 楼主| 发表于 2017-3-8 15:34:17 | 显示全部楼层

转换bam  第一步就卡住了 一直这样子半小时了  正常吗?


总是输2个验证码好麻烦啊 一个就够了吧

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-9-22 08:32 , Processed in 0.041548 second(s), 30 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.