你好,欢迎访问远方教程PC版!
广告位招租

R技巧[13]:R实现字符串的子字符串频率统计|R子串测试

[日期:2015-08-29]   来源:远方教程  作者:远方教程   阅读:4297次[字体: ] 访问[旧版]
 捐赠远方教程 

  本文整理自统计之都

方法一   使用strsplit函数

a <- "aggcacggaaaaacgggaataacggaggaggacttggcacggcattacacggagg" 
b <- strsplit(as.character(a),"ag") 
length(b[[1]]) - 1  ##子字符串"ag"的出现个数 

方法二   使用正则式函数

a <- "aggcacggaaaaacgggaataacggaggaggacttggcacggcattacacggagg" 
b <- strsplit(as.character(a),"ag") 
regexpr("ag",a) 
gregexpr("ag",a) 
gregexpr("a.g",a) 
attr(gregexpr("a.g",a)[[1]], "match.length")   #提取子模式长度 

方法三  使用str_count函数

library(stringr) 
str_count("1212345", c("12", "23", "00"))  
 

图片展示
 
相关评论
站长推荐