在R中,您可以使用dplyr包来按ID分组和按活动时间分组,并使用lubridate包计算时间差。
首先,我们需要安装和加载所需的包:
install.packages("dplyr")
install.packages("lubridate")
library(dplyr)
library(lubridate)
然后,我们可以创建一个示例数据框,其中包含ID和活动时间两列:
data <- data.frame(ID = c(1, 1, 2, 2, 2, 3, 3),
activity_time = c("2021-01-01 09:00:00", "2021-01-01 09:02:00",
"2021-01-01 10:00:00", "2021-01-01 10:01:00",
"2021-01-01 10:05:00", "2021-01-01 11:00:00",
"2021-01-01 11:01:00"))
接下来,我们可以使用dplyr的group_by函数按ID分组,并使用lubridate的floor_date函数按活动时间分组为每个活动的5分钟:
data <- data %>%
mutate(activity_time = ymd_hms(activity_time)) %>%
group_by(ID, activity_group = floor_date(activity_time, "5 minutes"))
最后,我们可以使用dplyr的mutate函数来计算每个活动时间的时间差:
data <- data %>%
mutate(time_diff = activity_time - lag(activity_time))
完整的代码如下:
install.packages("dplyr")
install.packages("lubridate")
library(dplyr)
library(lubridate)
data <- data.frame(ID = c(1, 1, 2, 2, 2, 3, 3),
activity_time = c("2021-01-01 09:00:00", "2021-01-01 09:02:00",
"2021-01-01 10:00:00", "2021-01-01 10:01:00",
"2021-01-01 10:05:00", "2021-01-01 11:00:00",
"2021-01-01 11:01:00"))
data <- data %>%
mutate(activity_time = ymd_hms(activity_time)) %>%
group_by(ID, activity_group = floor_date(activity_time, "5 minutes"))
data <- data %>%
mutate(time_diff = activity_time - lag(activity_time))
这样,您就可以得到按ID分组、按活动时间分组并计算活动时间的时间差的结果。
上一篇:按ID分组显示最新条目