在R中,可以使用distinct
函数来删除重复的行,该函数可以通过指定列名作为参数来匹配重复项。以下是使用distinct
函数根据列值过滤重复行的示例代码:
library(dplyr)
# 创建具有重复行的数据框
df <- data.frame(
id = c(1, 2, 3, 3, 4, 4),
name = c("Amy", "Bob", "Cathy", "Cathy", "David", "David"),
stringsAsFactors = FALSE
)
# 使用distinct函数按照name列的值进行过滤
df_filtered <- df %>% distinct(name, .keep_all = TRUE)
在上面的示例中,我们使用distinct
函数根据name
列的值过滤重复行,并保留所有列的值。.keep_all = TRUE
参数指示函数保留行中的所有列,而不仅仅是匹配列。
如果要根据多个列值过滤重复行,只需在distinct
函数中指定这些列名。例如:
df_filtered <- df %>% distinct(id, name, .keep_all = TRUE)
此示例将根据id
和name
列的值过滤重复行。
下一篇:按列值划分SQL Server表