搜索
查看: 2891|回复: 0

一个通过文献注释基因功能的数据库【Gene RIF】

[复制链接]

20

主题

68

帖子

870

积分

版主

Rank: 7Rank: 7Rank: 7

积分
870
QQ
发表于 2016-12-23 15:02:02 | 显示全部楼层 |阅读模式
本帖最后由 bioinfo.dong 于 2016-12-23 15:10 编辑

GeneRIF: Gene Reference into Function

当进行癌症基因组研究时,我们经常想找到跟癌症分期或者预后相关的基因,然后对其中某些重要的基因进行实验验证。这就如同大海捞鱼,你需要从几万条基因中挑出最感兴趣的那两三条。这不仅需要做好数据分析工作,还需要通过大量查找文献来选出最靠谱的候选基因。
今天偶然的机会在NCBI发现了GeneRIF数据库,该数据库通过总结已发表的文章来注释基因的功能。这在一定程度上可以减少我们自己查找文献的工作量,或者可以作为辅助工具帮助我们筛选候选基因。


1. 单个基因查找:如果仅需要查找几个基因,我们可以直接在NCBI网站上的Gene database进行中搜索
(1) 搜索


(2) 进入基因页面


(3) 下拉找到GeneRIF (右下角的数字显示该数据库对6448篇提到TP53的文章进行了总结)


(4) 查看该基因更详细的GeneRIF信息 (通过右上角的【Send to】可以导出该基因的所有信息,包括GeneRIF信息, 第(2)步的【Send to】也可以实现相同功能)


2. 批量查找多个基因的GeneRIFs信息
多数时候我们会得到成百上千个候选基因,一个个查找就背离了节省时间的初衷。作为生物信息工作者,重复输入重复复制粘贴重复下载的事情是不能忍的。任何时候我们首先想到的是我可以找到现成的工具达到我的目的吗,如果没有现成工具我可以快速写一个脚本吗。
对于现在要解决的问题,脚本容易写。所以关键是能否找到储存所有GeneRIFs的文档。幸运的是我们可以在NCBI FTP找到这个文档 (generifs_basic.gz)。下载完成后写个简单的脚本就可以批量提取所有候选基因的GeneRIFs信息了。


3. 问题
(1)GeneRIFs只是为我们筛选候选基因提供了一些参考,最终确定做哪个基因还要结合其他信息。
(2)因为平时主要用Google Scholar查文献,所以我对PubMed也不是特别熟,有个问题请教一下,如果我知道很多文章的PubMed ID,怎样批量找到这些文章对应的title等各种信息呢,希望有经验的小伙伴不吝赐教啊,多谢多谢~

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
You really shouldn't spend your time reinventing the wheel
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-9-16 09:10 , Processed in 0.029904 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.