搜索
查看: 1776|回复: 1

解析xml文件-得到broad存放在亚马逊云的公共数据

[复制链接]

634

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
发表于 2017-5-4 10:32:30 | 显示全部楼层 |阅读模式
网页是:https://s3.amazonaws.com/igv.broadinstitute.org
也可以解析:https://s3.amazonaws.com/1000genomes/

可以用浏览器打开,看到是xml格式的。

这个非常重要,尤其是开发网页工具的时候,没必要自己再辛辛苦苦存储一堆数据在自己的服务器上面。
只需要解析这个xml文件即可,perl/python/R都可以做到解析它。

首先根据基因组版本分开,看看每个基因组附带的注释文件有哪些,下面是随便给出的几个例子~

[AppleScript] 纯文本查看 复制代码
fastaURL: "https://s3.amazonaws.com/igv.broadinstitute.org/genomes/seq/1kg_v37/human_g1k_v37_decoy.fasta",
cytobandURL: "https://s3.amazonaws.com/igv.broadinstitute.org/genomes/seq/b37/b37_cytoband.txt"
url: "https://s3.amazonaws.com/igv.broadinstitute.org/annotations/hg19/genes/refGene.hg19.bed.gz",
indexURL: "https://s3.amazonaws.com/igv.broadinstitute.org/annotations/hg19/genes/refGene.hg19.bed.gz.tbi",
url: "https://s3.amazonaws.com/1000genomes/release/20130502/ALL.wgs.phase3_shapeit2_mvncall_integrated_v5b.20130502.sites.vcf.gz",
indexURL:  "https://s3.amazonaws.com/1000genomes/release/20130502/ALL.wgs.phase3_shapeit2_mvncall_integrated_v5b.20130502.sites.vcf.gz.tbi",





上一篇:测序数据处理云平台之galaxy安装篇
下一篇:sed最清楚的教程
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复

使用道具 举报

2

主题

41

帖子

385

积分

中级会员

Rank: 3Rank: 3

积分
385
发表于 2017-6-13 12:49:47 | 显示全部楼层
很赞~
每天都要进步一点点~
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-8-22 22:34 , Processed in 0.248052 second(s), 27 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.