搜索
查看: 717|回复: 0

[R] 第10章 使用stringr处理字符串

[复制链接]

14

主题

26

帖子

141

积分

注册会员

Rank: 2

积分
141
发表于 2018-10-17 16:49:48 | 显示全部楼层 |阅读模式
第10章 使用stringr处理字符串
这一章学之前感觉真的难,学之后感觉确实难   

其实本章的重点正如书中所示在于使用正则表达式处理字符型数据,首先要学会正则表达式啊!这个名字听起来就是很厉害的样子…原谅我小白的无限崇拜,发现自己好久没有更新笔记了。最近要抓紧更新一下!
准备工作
[AppleScript] 纯文本查看 复制代码
1library(tidverse)
2library(stringr)
首先创建一个字符串
[AppleScript] 纯文本查看 复制代码
1(test_stringr1<- "hellow word")
2#记得加()是既加入变量又打印吧 
3
4class(test_stringr1)[mw_shl_code=applescript,true]

5[1] "character"[/mw_shl_code]
这里书上先介绍了为什么“”或者’‘在里面不能算是一个字符型的向量,也介绍了如果想表示应该如何进行表达。其实这里面的转义运用的就是后边要介绍的正则表达式。所以读到这里很懵b的状态也没关系。
计算字符串的长度
这里面使用了stringi函数,先看看stringi函数里面究竟有什么吧!(提示使用help()函数)
stringi is THE R package for fast, correct, consistent, and convenient string/text manipulation. It gives predictable results on every platform, in each locale, and under any “native” character encoding.
Keywords: R, text processing, character strings, internationalization, localization, ICU, ICU4C, i18n, l10n, Unicode.
[AppleScript] 纯文本查看 复制代码
1str_length(c(test_stringr1,NA))
2[1] 11 NA
A numeric vector giving number of characters (code points) in each element of the character vector. Missing string have missing length.
很明显str_length函数的默认值是不计算缺失值NA的
字符串的组合
这里主要介绍了str_c函数,这个函数就是连接前后两个或多个字符型变量,连接符号(seq)可以自定义。这里比较有意思的是向量化这个,感觉说向量化感觉很吊,我个人感觉就是一个的去匹配几个的字符型变量。有点像数学公式x(x1+x2+x3)=xx1+xx2+xx3
关于if那个本书写的有点省略,我补全一下
[AppleScript] 纯文本查看 复制代码
1name <- "Hadley"
2time_of_day <- "morning"
3birthday <- FALSE
4str_c("Good",time_of_day," ",name,
5+       if(birthday==FALSE)" and HAPPLY BIRTHDAT",".")
6"Goodmorning Hadley and HAPPLY BIRTHDAT."




上一篇:问题待解决3-有哪些拿来就用的生存分析数据库?
下一篇:&lt;R for Data Science&gt; 读书笔记3 | 第五章: 探索性数据分析(1)
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-12-16 11:35 , Processed in 0.029207 second(s), 27 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.