搜索
查看: 1996|回复: 0

缺失值和重复值的处理办法

[复制链接]

5

主题

18

帖子

144

积分

注册会员

Rank: 2

积分
144
发表于 2017-1-17 15:51:16 | 显示全部楼层 |阅读模式
很常见的的处理数据的方法,希望对入门者有用,高手略过
1.删除缺失值
dataset1<-na.omit(dataset)
2.删除重复值
如dataset数据集中Ensembl.Gene.ID这一列存在重复值
(1)建立是否重复索引
index<-duplicated(data.set$Ensembl.Gene.ID)
index
在后面我们用!来取反:
data.set1<-data.set[!index,]
data.set1




上一篇:生信编程直播第六题:下载最新版的KEGG信息,并且解析好
下一篇:DESeq2包的系统学习
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2020-6-1 13:12 , Processed in 0.029866 second(s), 27 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.