要按包含特定值的列对数据框进行分组,可以使用dplyr包提供的group_by()函数。下面是一个示例代码:
library(dplyr)
# 创建一个示例数据框
df <- data.frame(
name = c("Alice", "Bob", "Charlie", "Alice", "Bob", "Charlie"),
age = c(25, 30, 35, 40, 45, 50),
gender = c("Female", "Male", "Male", "Female", "Male", "Male")
)
# 按name列进行分组
grouped_df <- df %>%
group_by(name)
# 查看分组后的数据框
print(grouped_df)
输出结果如下:
# A tibble: 6 x 3
# Groups: name [3]
name age gender
1 Alice 25 Female
2 Bob 30 Male
3 Charlie 35 Male
4 Alice 40 Female
5 Bob 45 Male
6 Charlie 50 Male
在上面的代码中,我们使用group_by()函数将数据框按name列进行分组,并将结果保存在grouped_df对象中。最后,我们打印出分组后的数据框。