搜索
查看: 8496|回复: 11

[Shell] 新手小白版 生信分析人员如何系统入门linux?

[复制链接]

10

主题

59

帖子

269

积分

版主

Rank: 7Rank: 7Rank: 7

积分
269
发表于 2016-9-8 05:34:50 | 显示全部楼层 |阅读模式

讲真,之前我一点linux基础也没有,也不知道如果要学习liunx要掌握到哪种地步,但是站主这个帖子好啊!让我知道了怎么上手.http://www.bio-info-trainee.com/1661.html

截取一部分.

生信分析人员如何系统入门linux?
linux系统在生物信息学数据处理中的重要性就不用我多说了,鉴于一直有学生问我一些很显而易见的问题,对系统性的学习并理解了linux系统操作的专业人士来说是显而易见的。
我在这里仅以过来人的角度给大家总结一下linux该如何学,该学什么,该花多少工夫,学习重点是什么?
就我个人这么多年处理生物信息学数据经验来看,可以把linux的学习过程分成三个阶段:
一是把linux系统玩得跟windows系统一样顺畅。
这一阶段的主要目的就是去可视化,熟悉黑白命令行界面。
如何连接服务器(xshell,putty,VNC~~~),了解你在服务器上面有什么权限。
左右鼠标单击双击如何实现?磁盘文件浏览如何实现?文件操作如何实现?绝对路径和相对路径区别?
需要了解的命令有下面这些:

    pwd/ls/cd/mv/rm/cp/mkdir/rmdir/man/locate/head/tail/less/more
    cut/paste/join/sort/uniq/wc/cat/diff/cmp/alias
    wget/ssh/scp/curl/ftp/lftp/mysql/

大家可以搜索(每天一个linux命令的博客)来跟着练习,或者看一些linux视频(百度云共享了一大堆,建议看鸟哥linux私房菜),或者关注一些linux学习相关公众号,加入一些linux社区,论坛,当然如果你只是简单了解,搞生物信息学其实没必要那么深入理解,跟着一本像样的入门书籍,完整的学习即可!
不懂的名词,赶紧谷歌搜索,多记笔记。




上一篇:vim简单命令
下一篇:phantom peaks 一二三
回复

使用道具 举报

10

主题

59

帖子

269

积分

版主

Rank: 7Rank: 7Rank: 7

积分
269
 楼主| 发表于 2016-9-8 05:38:45 | 显示全部楼层
本帖最后由 bioinfo何婷 于 2016-9-9 07:20 编辑

我结合站主的问题加上对照一本超好的书 生物人的电脑教室:高通量定序分析一次搞定  (在google book上可以买到电子版)摘取了些书内的生物信息人需要掌握的liunx知识.此书是以生物人的角度写的书,崇尚计算机知识不过多讲,够用就好,我感觉很值得购买


文件夹操作
1 pwd:path of working directory,输入之后就会显示你目前的目录是什么

2 ls:list,列出文件夹与文件

3 ls -lh:long format(显示详细信息,如大小,日期,权限),human read(人可以看懂的格式),第一行显示这个文件夹内所有文件的合计大小,日期和时间,最后是完整档名

4 cd :change directory,更换工作目录,如cd <文件夹名>

5 cd .. 切换到上一层

6 mkdir: make directory,建立文件夹

7 rmdir: remove directory,删除文件夹

文件操作

1 cp: copy,复制文件,如cp<原文件名称><新的文件名称>,注意新名字不能和原名自一样,取新名字的时候可以在原名称的基础上加.bak表示备份的意思。用cp将文件拷到某一文件夹下,如cp<原文件名称><文件夹路径>

2 rm: remove,删除文件,如rm<文件名>,也可用来删除非空文件夹,如rm -rf <文件夹名>

3 mv:move,移动文件,如mv<文件名><文件夹名>,也可用来更换文件夹名,如mv<原文件名><信文件名>


权限的指派和分配

1 linux系统安全的原因很大部分是因为有完整的权限规范。没有权限就没有存取或者执行的权利

2 chown: change owner,改变文件所有者,如chown<使用者帐号名称><文件名>,此时需要在前面加上sudo,表示暂时以系统管理员的名义执行

3 chmod: change mode,更改模式,这个很常用,因为当从网上下载生物信息工具或者执行脚本,通常都没有执行的权限,导致直接输入文件名没有办法执行,因此我们要为他加上权限,如chomd +x<文件名>,x为execute权限意。对于第一次接触权限的人,除了执行权限以外还要考虑读取和写入的要求,此时+x是不够的,可以直接使用chomd 777<文件名>,777是权限的第一,执行代码是1,写入代码是2,读取代码是4,加在一起就是7,三位数表示不同的身份,文件所有者,文件所有者群组和其他人,777表示三种身份可以全部获取权限


系统相关指令

1 meminfo:了解电脑里有多少内存,输入cat /proc/meminfo
[Bash shell] 纯文本查看 复制代码
bash-4.2$ cat /proc/meminfo
MemTotal:       1056862284 kB
MemFree:        416375684 kB
MemAvailable:   915386776 kB
Buffers:             976 kB
Cached:         516132060 kB
SwapCached:       994316 kB
Active:         245947200 kB
Inactive:       379525892 kB
Active(anon):   108710828 kB
Inactive(anon): 24892040 kB
Active(file):   137236372 kB
Inactive(file): 354633852 kB
Unevictable:       44052 kB
Mlocked:           44052 kB
SwapTotal:      344625144 kB
SwapFree:       336930000 kB

看第一行即可,除1024计算内存

2 cpuinfo:查询处理器的规格,输入cat /proc/cpuinfo
[Bash shell] 纯文本查看 复制代码
processor : 63
vendor_id : GenuineIntel
cpu family : 6
model : 47
model name : Intel(R) Xeon(R) CPU E7- 4830 @ 2.13GHz
stepping : 2
microcode : 0x37
cpu MHz : 2133.000
cache size : 24576 KB
physical id : 3
siblings : 16
core id : 25
cpu cores : 8
apicid : 243
initial apicid : 243
fpu : yes
fpu_exception : yes

看processor和model name即可,如我得processor旁边数字为63,意思是我有64核心(从0计算),而model name,型号是 Intel(R) Xeon(R) CPU E7- 4830  @ 2.13GHz,就是intel xeon处理器,上网可搜到详细的资料

3 df,用来查看磁盘空间,磁盘空间在生物计算时十分重要,不只是用来储存原始资料,计算过程中也需要磁盘空间储存,或者用磁盘空间当作内存不足是的缓冲,在linux本身就有swap的机制.输入 df -h
[Bash shell] 纯文本查看 复制代码
bash-4.2$ df -h
文件系统 容量 已用 可用 已用% 挂载点
devtmpfs 504G 0 504G 0% /dev
tmpfs 504G 25G 480G 5% /dev/shm
tmpfs 504G 4.0G 500G 1% /run
tmpfs 504G 0 504G 0% /sys/fs/cgroup
/dev/mapper/cl_galaxy-root 2.7T 15G 2.7T 1% /


4 top:查询正在进行的工作,会显示目前执行的程序和耗用的cpu与内存比

其他

1 cat:显示文件内容,如cat<文件名>

2 wget:从网络下载文件,如wget<完整网址>,wget支持http,ftp

3 scp:远端文件传输,用于把文件从终端传到另一个服务器,如 scp <本机文件名><远端帐号名>@<远端主机地址>:<远端主机存放路径>

4 tar: 将文件打包,从网上下载的文件爱呢,很多都是用tar封装的,可以靠他解压,如 tar -cvf<打包文件名><文件夹名>.通常打包文件名后会有tar字样,若是用gzip压缩,会以gz结尾,以bzip2格式压缩以bz2结尾(参数要改成 -czvf或-cjvf).解压缩,如tar -xvf<打包后的文件名>,若是zip文件就要输入unzip <文件名>.

站主帖子里面提出的问题还有很多没有解决欢迎大家跟帖补充!
回复 支持 1 反对 0

使用道具 举报

10

主题

59

帖子

269

积分

版主

Rank: 7Rank: 7Rank: 7

积分
269
 楼主| 发表于 2016-9-8 05:45:43 | 显示全部楼层
啊 并且这本书对于小白入门高通量测序特别好 我发誓我不是打小广告的 诚心推荐
回复 支持 反对

使用道具 举报

634

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
发表于 2016-9-8 07:02:14 | 显示全部楼层
做的很棒,对了,你有服务器了吗?我这边多几个,给你练习呗
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复 支持 反对

使用道具 举报

10

主题

59

帖子

269

积分

版主

Rank: 7Rank: 7Rank: 7

积分
269
 楼主| 发表于 2016-9-8 10:45:56 | 显示全部楼层
Jimmy 发表于 2016-9-8 07:02
做的很棒,对了,你有服务器了吗?我这边多几个,给你练习呗

谢谢jimmy,学校有服务器了,跑过数据了,但是不知道为什么有submit error, PBS script提交不上去
回复 支持 反对

使用道具 举报

3

主题

7

帖子

50

积分

注册会员

Rank: 2

积分
50
发表于 2016-9-19 10:50:00 | 显示全部楼层
你好,看了你的帖子,想请教一下。
cat pb.MHC.sorted.header.dup.realn.BQSR.reduce.unitype.vcf | awk '{if ($5!=".") print $0}' | wc -l
这条命令是用来统计第五列为“.”的行数,请问怎么操作的= =
回复 支持 反对

使用道具 举报

10

主题

59

帖子

269

积分

版主

Rank: 7Rank: 7Rank: 7

积分
269
 楼主| 发表于 2016-9-20 01:07:18 | 显示全部楼层
shangpeilin 发表于 2016-9-19 10:50
你好,看了你的帖子,想请教一下。
cat pb.MHC.sorted.header.dup.realn.BQSR.reduce.unitype.vcf | awk '{ ...

哈哈哈哈 尚同学 你好正经。。好不习惯。。。
[Bash shell] 纯文本查看 复制代码
-bash-4.2$ awk -v sum=0 '{if($5="A") sum++}END{print sum}' cam10.vcf
715

这样可以统计第五行满足什么条件
回复 支持 反对

使用道具 举报

3

主题

7

帖子

50

积分

注册会员

Rank: 2

积分
50
发表于 2016-9-20 10:14:51 | 显示全部楼层
bioinfo何婷 发表于 2016-9-20 01:07
哈哈哈哈 尚同学 你好正经。。好不习惯。。。
[mw_shl_code=bash,true]-bash-4.2$ awk -v sum=0 '{if($5= ...

= =我没想到我的名字是这个啊!!!!暴露了
回复 支持 反对

使用道具 举报

0

主题

5

帖子

62

积分

注册会员

Rank: 2

积分
62
发表于 2016-10-27 12:43:04 | 显示全部楼层
楼主你好《生物人的电脑教室:高通量定序分析一次搞定》这本书我找不到,能发个链接
或者分享一下电子版吗?
回复 支持 反对

使用道具 举报

0

主题

1

帖子

90

积分

注册会员

Rank: 2

积分
90
发表于 2016-10-27 14:33:37 | 显示全部楼层
同问,生物人的电脑教室:高通量定序分析一次搞定,怎么下载或购买,我在国内。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-8-23 18:02 , Processed in 0.059271 second(s), 30 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.