搜索
查看: 461|回复: 1

[mRNA-seq] 转录组入门---作业

[复制链接]

8

主题

19

帖子

139

积分

注册会员

Rank: 2

积分
139
发表于 2017-10-11 21:20:38 | 显示全部楼层 |阅读模式
新手,完完全全的新手,但是我想把自己的每一步都记录下来,也希望园友可以多多指正,共同进步。作业主要参考了PANDA姐的优秀作业,HOPTOP转录组入门作业。
1.linux bash的准备:我系统是win10,内存只有4G,所以我去加了一个8G的内存条。按照http://www.xitongzhijia.net/xtjc/20160411/70310.htmlhttp://www.xitongzhijia.net/xtjc/20170309/93662.html指示开启,只是要注意在linux输入密码的时候,是不会显示出来的,只需要自己默输两遍即可。
2.在win系统上下载了git,notepad++,everything这三个软件。git软件安装指引:http://blog.csdn.net/zzfenglin/article/details/53147604。notepad++有的人说是高级的记事本,即使没有保存关闭了也没事,http://blog.csdn.net/piaoxuan1987/article/details/38948073。everything:http://blog.csdn.net/quincylk/article/details/8266338Jimmy 大神之前的帖子生信人的windows电脑必装软件有git,everything。http://www.biotrainee.com/thread-833-1-1.html
3.sratoolkit
功能: 下载,操作,验证NCBI SRA中二代测序数据
cd /mnt/d/Software/Biosoft
mkdir sratoolkit &&  cd sratoolkit
wget https://ftp-trace.ncbi.nlm.nih.g ... 2-1-ubuntu64.tar.gz
tar -zxvf sratoolkit.2.8.2-1-ubuntu64.tar.gz
4.fastqc 可视化展示二代测序数据质量
cd /mnt/d/Software/Biosoft
mkdir fastqc &&  cd fastqc
wget http://www.bioinformatics.babrah ... /fastqc_v0.11.5.zip
unzip fastqc_v0.11.5.zip
6.HISAT 将测序结果比对到参考基因组上
cd /mnt/d/Software/Biosoft
mkdir HISAT  &&  cd HISAT
wget ftp://ftp.ccb.jhu.edu/pub/infphi ... t2-2.1.0-source.zip
unzip hisat2-2.1.0-source.zip
cd hisat2-2.1.0
make
rm -f *.h *.cpp
7.anaconda的安装:
从这一步开始就出现系统提示链接不上github,去google了一下,因为我没有linux基础,只接触了了一点R。最后我就放弃自己安装这些。看到大家都是用anaconda,而且成功率还蛮高的样子。但是我的安装曲线还是很曲折。
然后参考了知乎https://zhuanlan.zhihu.com/p/25085567,生信技能树http://www.bio-info-trainee.com/1906.html
然后就
cd /mnt/d/Software/Biosoft
wget https://repo.continuum.io/minico ... est-Linux-x86_64.sh
bash Miniconda2-latest-Linux-x86_64.sh



然后出现报错:ValueError: unsupported hash type md5

ERROR:root:code for hash sha1 was not found.
ValueError: unsupported hash type sha1
后面我就卸载了
rm -rf ~/miniconda
用ls -al 查看了隐藏的.condarc 、.conda以及.continuum文件,用rm -rf一起删除了。但是我的~/bashrc.还是有miniconda的路径。
后面我又安装了anaconda,在这里我详细记录下我安装过程。
wget https://repo.continuum.io/archive/Anaconda3-4.4.0-Linux-x86_64.sh
bash Anaconda3-4.4.0-Linux-x86_64.sh后面点击回车,按要求输入yes。source ~/.bashrc 这一步我看官网上说关闭linux bash也是可以生效的,source一下可以立即生效。输入:conda和conda list可以显示相应的信息和已安装的软件。添加channel,换成清华的镜像源。这一步很重要,用默认的我根本下不了。conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/biocondaconda config --set show_channel_urls yes
conda config --get channels然后就好啦8.samtools 存放高通量测序比对结果的标准格式conda install -c bioconda samtools=1.59.HTSeq 的安装:根据比对结果统计基因countconda install -c bioconda htseq=0.7.2安装完以后可以用:conda list查看安装的软件,可以看到我们刚刚安装的软件。10.R和R studio 我本来电脑就有安装这些,在win安装就好。总结:由于不懂linux觉得安装个软件都弄到好久,还是建议用anaconda安装吧,比较方便。现在自己也在一遍恶补linux,一边学习python。至于R,我接触了一点,还是比较有底。




上一篇:GPL8786如何能在bioconductor里找到对应的数据包
下一篇:Trinity 教程
回复

使用道具 举报

2

主题

31

帖子

270

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
270
发表于 2017-10-12 09:19:39 | 显示全部楼层
如果你愿意学习markdown,下载typora软件,把这个帖子重新排版一下,有机会在生信技能树公众号里面发布,让上千人观摩你的学习经验,赶快去联系jimmy吧。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树    

GMT+8, 2017-12-18 05:39 , Processed in 0.080457 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.