热点新闻
dplyr-mutate-across 选择多列应用函数示例
2023-07-21 02:51  浏览:3055  搜索引擎搜索“养老之家”
温馨提示:信息一旦丢失不一定找得到,请务必收藏信息以备急用!本站所有信息均是注册会员发布如遇到侵权请联系文章中的联系方式或客服删除!
联系我时,请说明是在养老之家看到的信息,谢谢。
展会发布 展会网站大全 报名观展合作 软文发布

mutateacross()配合可用于在dplyr数据处理管道(%>%)中方便地选择多列进行相应的函数处理,从而避免了数据处理过程中管道外使用lapply或循环结构,有效保证代码的整洁统一。

mutate() 的主要功能是创建新列,而且一旦创建就可以立即在管道符使用。
across(.cols = , .fns = )函数常用的只有两个参数,.cols = 和 .fns = 分别指定选取用于遍历的列变量 和 处理函数。

指定列向量转换 向量类型

df %>% mutate(across(.cols = c(x, y, z), .fns = as.character)) #将x, y, z三列转换为字符型向量 df %>% mutate(across(.cols = 1:3, .fns = as.character) ) #改变1:3列的向量元素类型为字符型 df %>% mutate(across(.cols = everything(), .fns = as.character)) #将所有列转换为字符型向量 str(df) #查看数据框列向量类型

将所有字符型的列向量转换为数值型

df %>% mutate(across(where(is.character), as.numeric, .names = '{.col}.2')) ## .names 参数指定新新列名,{.col}代表旧列的列名

数据表中单元值的替换

df %>% mutate(across(across(everything(), ~replace(.x, .x == "replacement" , "parttern")))

使用across()隐函数处理列向量

注: ~是R语言隐函数[lambda]的写法,翻译为代表function(x){...}; 而 .x 或 .则是指向当前被遍历的列向量。

df %>% mutate(across(everything(),~ scale(.),.names = '{.col}.scale')) #对列向量进行中心化 df %>% drop_na() %>% mutate( across(where(is.numeric), log) ) #对数化 df %>% mutate(across(c(x,y), ~quantile(.,0.95,na.rm = TRUE), .names = '{.col}_quantitle') ) #计算列向量0.95分位数 df %>% mutate(across(everything(),~ .x / sum(.x, na.rm = TRUE))) #计算列向量值百分比

替换y列小于0的值为NA

df %>% mutate( across(contains("y"), ~ if_else(.x < 0, NA_real_, .x)) )

参考材料:
Why I love dplyr's across - Will Hipson
第 40 章 tidyverse中的across()之美1 | 数据科学中的 R 语言 (bookdown.org)

发布人:044c****    IP:117.173.23.***     举报/删稿
展会推荐
让朕来说2句
评论
收藏
点赞
转发