搜索
查看: 1377|回复: 3

[其他] 如何通过扒虫扒取网页基因数据

[复制链接]

1

主题

4

帖子

40

积分

新手上路

Rank: 1

积分
40
发表于 2018-5-24 12:40:16 | 显示全部楼层 |阅读模式


请教大牛,如何能批量扒取网站的基因注释信息?手动一条一条下载速度很慢。谢谢!



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

4

主题

51

帖子

327

积分

中级会员

Rank: 3Rank: 3

积分
327
发表于 2018-5-29 10:28:16 | 显示全部楼层
python相关库(每个部分选一个):
网页获取——urllib,requests,scrapy
信息提取——beautifulsoap4,re

另外需要你懂一些html的基本语法

推荐链接:https://www.zhihu.com/question/20899988
回复 支持 反对

使用道具 举报

1

主题

4

帖子

40

积分

新手上路

Rank: 1

积分
40
 楼主| 发表于 2018-6-2 12:06:45 | 显示全部楼层
xuehzh95 发表于 2018-5-29 10:28
python相关库(每个部分选一个):
网页获取——urllib,requests,scrapy
信息提取——beautifulsoap4,re ...

好的,谢谢!
回复 支持 反对

使用道具 举报

0

主题

3

帖子

33

积分

新手上路

Rank: 1

积分
33
发表于 2018-6-4 19:27:16 | 显示全部楼层
IRGsP可以下载基因组注释信息, 自己提取需要的数据就行了呀
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树    

GMT+8, 2019-6-20 20:08 , Processed in 0.031992 second(s), 24 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.