|
R fot data science 第10章 使用stringr处理字符串10.1 简介10.2 字符串基础可以使用单引号或双引号来创建字符串。与其他语言不同,单引号和双引号在 R 中没有区别。 如果想要在字符串中包含一个单引号或双引号,可以使用 \ 对其进行“转义” double_quote<-"\""# or '"'
single_quote<-'\''# or "'"如果想要在字符串中包含一个反斜杠,就需要使用两个反斜杠:\ 如果想要查看字符串的初始内容,可以使用 writelines() 函数 x<-c("\"", "\\")
x
#> [1] "\"" "\\"
writeLines(x)最常用的是换行符 \n 和制表符 \t 多个字符串通常保存在一个字符向量中,你可以使用 c() 函数来创建字符向量 字符串长度 file:///Users/huimei/Library/Application%20Support/typora-user-images/image-20181126151126078.png?lastModify=1543277617 字符串组合 组合两个或更多字符串,可以使用 str_c() 函数 和多数 R 函数一样,缺失值是可传染的。如果想要将它们输出为 "NA",可以使用 str_replace_na() 要想将字符向量合并为字符串,可以使用 collapse() 函数
字符串取子集 区域设置
10.3 使用正则表达式进行模式匹配str_view(x, "a$")x<-c("apple pie", "apple", "apple cake")
str_view(x, "apple")
str_view(x, "^apple$")10.4 工具多种 stringr 函数,它们可以 确定与某种模式相匹配的字符串; 找出匹配的位置; 提取出匹配的内容; 使用新值替换匹配内容; 基于匹配拆分字符串。
匹配检测
分组匹配 括号在正则表达式中的用法 它可以阐明优先级 能对正则表达式进行分组 分组可以在匹配时回溯引用
替换匹配内容 拆分 定位匹配内容
10.5 其他类型的模式10.6 正则表达式的其他应用10.7 stringi
|
|