R语言数据处理方法~小结
另: 一些汇总时的小函数 n(): 计算个数?n_distinct(x): 计算 x 中唯一值的个数 3.3 链式操作(管道) %>% 或 %.% dplyr包还新引进了一个操作符,读成then,使用时把数据名作为开头,然后依次对此数据进行多步操作。比如: 按数据处理的思路写代码,一步步深入,?既易写又易读,接近于从左到右的自然语言顺序, 对比一下用R自带函数实现的. 文章里还表示: 通过 %>% 那段代码比跑上面这段代码,运算速度提升很多倍. 至于这个新鲜的概念会不会和 ggplot2 里的 + 连接号一样,发挥出种种奇妙的功能呢? 还是在实际使用中多体验感受吧. 3.5 数据匹配合并join(1)inner_join(x,y) :只包含同时出现在x,y表中的行 (2)left_join(x,y) :包含所有x中以及y中匹配的行 (3)semi_join(x,y) :包含x中,在y中有匹配的行,结果为x的子集 (4)anti_join(x,y) :包含x中,不匹配y的行,结果为x的子集,与semi_join相反 (5)full_join(x,y) :包含所以x、y中的行 (6)right_join(x,y) :包含所有y中以及x中匹配的行 (1)dplyr 可以连接数据库 (1)使用与本地数据框操作一样的语法 (3)只支持生成SELECT语句 (4)支持SQLite,PostgreSQL/Redshift,MySQL/MariaDB,BigQuery,MonetDB 3.7 利用窗体函数变换数据
4. tidyr tidyr包的作者也是Hadley Wickham,与dplyr包结合使用,是reshape2包的替代。(先挖坑...) 5. 字符串处理 5.1 字符个数 nchar nchar()能够获取字符串的长度,它和length()的结果是有区别的。 (编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |