下面是一个使用dplyr包在R中按照唯一值进行分组,并找到持续时间,同时满足多个条件的示例代码:
library(dplyr)
# 创建示例数据框
df <- data.frame(
group = c("A", "A", "B", "B", "B", "C"),
time = c("2021-01-01", "2021-01-02", "2021-01-01", "2021-01-02", "2021-01-03", "2021-01-01"),
condition1 = c(TRUE, TRUE, FALSE, TRUE, FALSE, TRUE),
condition2 = c(FALSE, TRUE, TRUE, FALSE, TRUE, TRUE)
)
# 将时间列转换为日期类型
df$time <- as.Date(df$time)
# 按照group列进行分组,并计算持续时间
result <- df %>%
group_by(group) %>%
arrange(time) %>%
mutate(duration = difftime(lead(time), time, units = "days")) %>%
filter(condition1 & condition2)
# 查看结果
print(result)
这段代码首先加载了dplyr包,然后创建了一个示例数据框df。数据框包含group列、time列、condition1列和condition2列。我们要按照group列进行分组,并找到同时满足condition1和condition2的时间段。
接下来,我们将time列转换为日期类型,以便后续计算持续时间。然后使用dplyr中的group_by函数按照group列进行分组。使用arrange函数按照时间排序数据框。然后使用mutate函数计算持续时间,使用lead函数获取下一个时间点,然后使用difftime函数计算两个时间点之间的持续时间。
最后,使用filter函数筛选出同时满足condition1和condition2的行。
最后,我们打印出结果result,即按照唯一值进行分组,并找到持续时间,同时满足多个条件的结果。
上一篇:按照唯一值进行分区