在dplyr中,我们可以使用group_by()函数按照变量分组,然后使用summarise()函数对每个组进行求和操作。
下面是一个使用dplyr对数据框按变量分组并求和的示例代码:
library(dplyr)
# 创建示例数据框
df <- data.frame(
group = c("A", "A", "B", "B", "B"),
value = c(1, 2, 3, 4, 5)
)
# 按变量group分组并求和
result <- df %>%
group_by(group) %>%
summarise(sum_value = sum(value))
print(result)
输出结果:
# A tibble: 2 x 2
group sum_value
1 A 3
2 B 12
在上面的示例中,我们首先加载了dplyr库,然后创建了一个示例数据框df,其中包含了一个分组变量group和一个数值变量value。
接下来,使用%>%操作符将数据框传递给group_by()函数,以group变量进行分组。然后,再使用summarise()函数对每个组进行求和操作,将结果保存在名为sum_value的新变量中。
最后,使用print()函数打印出结果数据框result。
通过上面的代码,我们可以按变量分组并在dplyr中求和。