搜索
查看: 3033|回复: 2

检索CistromeMap知识库看感兴趣转录因子是否被研究过

[复制链接]

634

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
发表于 2016-9-13 20:45:17 | 显示全部楼层 |阅读模式
CistromeMap知识库(http://cistrome.org/db/#/ )收录 24,000 (until 01/01/2016) 套人和小鼠的ChIP-seq数据,用自己统一的流程来处理了这些数据。 是哈佛刘小乐的实验室出品的,而且网站本身提供了非常详尽的教程:http://cistrome.org/db/#/tutorial 而且还提供在线的galaxy云计算平台供用户上传自己的数据来用他们的流程处理: user can directly send data to our Cistrome analysis pipeline for subsequential analysis.


就是在主页输入自己想搜索的转录因子的标准英文名,然后点击你感兴趣的查询结果,下面出现该套数据的简介,包括GEO数据库的链接,处理条件,对照是什么,哪个物种,数据来源的文章,细胞系,细胞类型,组织类型,疾病类型,网站维护者还是蛮用心的在整理和收集数据。
数据质量评价在右侧,绿色表示质量好,绿色的圆点越多,质量越好,列出了标准的4项分析结果:
1、QC的一些结果,就是我们一般做CHIP-seq数据分析流程的代码应该覆盖到的计算点。
2、motif分析结果,一般来时CHIP-seq实验里面pull down的序列都是TF结合序列,所以一定会有TF相关的motif,但是也不排除其它非特异的motif,大家可以详细的查看那个表格。
3、可能的转录因子靶向作用基因,一般按照置信度排序咯,可以看看自己感兴趣的基因是否在这个列表中。
4、寻找相似的TF,预示着他们可能有着相似的功能,甚至两者之间有结合,可以考虑做一个做个CoIP验证一下。


当然,搜索条件肯定不止转录因子这一种,用户可以还需要搜索assay,cell或者tissue相关信息,或者直接搜索基因,都是可以在对应的搜索框。

而且作者给出自己对CHIP-seq数据分析的是流程:
[Shell] 纯文本查看 复制代码
mapping step: bwa aln -q 5 -l 32 -k 2 -t 8 index FASTQ > sai bwa samse index sai FASTQ > sam
reads filter step: samtools view -bS -t chromInfo_file.txt -q 1 sam > bam
(optional)sort bam: samtools sort -m 4000000000 bam > bam_sort
(optional)collect statistics: samtools flagstat bam > bam.stat
Peak calling: macs2 callpeak --SPMR -B -q 0.01 --keep-dup 1 --extsize=146 --nomodel -g hs -t bam -n test
bigwiggle generation: bedtools intersect -a bedGraph -b chrom.bed -wa -f 1.00 > bedGraph.tmp bedGraphToBigWig bedGraph.tmp chromInfo_file.txt bigwiggle
choose the top 5k summits for motif scan, use all summits if the number of summits is less than 5k: MDSeqPos.py -d -w 600 -p 0.001 -m cistrome.xml -O output bed hg38
choose the top 10k peaks for RP computing: RegPotential.py -t top -g refGene -n test -d 100000






上一篇:主成分分析
下一篇:Somatic-Mutations-calling大全-biostar经典帖子系列
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复

使用道具 举报

21

主题

51

帖子

176

积分

信息监察员

Rank: 9Rank: 9Rank: 9

积分
176
发表于 2016-9-18 15:05:11 | 显示全部楼层
楼主您好,请教您一个问题,您说的这个网站我去看了,我发现网站上面的转录因子都是类似于基因symbol类似的样子,可是我从TRANFAC数据库match工具当中得到的转录因子是这样的
AP-4
Arnt
Barbie Box
CCAAT box
CDP CR1
C/EBP
c-Myb       
COMP1
CRE-BP1/c-Jun

并不是那么规则,他们之间有某种转换关系吗?我看cistome DB 官网上说这个数据库包含了大部分转录因子。Cistrome DB is valuable resource for transcriptional and epigenetic gene regulation study. It contains majority of currently available TFs and histone ChIP-seq data.
学习的痛苦是一时的,学到的快乐是长久的。
回复 支持 反对

使用道具 举报

634

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
 楼主| 发表于 2016-9-19 09:18:24 | 显示全部楼层
happylittlepig 发表于 2016-9-18 15:05
楼主您好,请教您一个问题,您说的这个网站我去看了,我发现网站上面的转录因子都是类似于基因symbol类似的 ...

转录因子本质上,是蛋白质,是蛋白质,就是由基因翻译的,所以是对应到gene symbol这个ID上面的!

根据转录因子的作用特点可分为二类;第一类为普遍转录因子,它们与RNA聚合酶Ⅱ共同组成转录起始复合体时,转录才能在正确的位置开始。除TFⅡD以外,还发现TFⅡA,TFⅡF,TFⅡE,TFⅡH等,它们在转录起始复合体组装的不同阶段起作用。第二类转录因子为组织细胞特异性转录因子,这些TF是在特异的组织细胞或是受到一些类固醇激素\生长因子或其它刺激后,开始表达某些特异蛋白质分子时,才需要的一类转录因子。
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-8-23 17:58 , Processed in 0.035515 second(s), 31 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.