按组返回下一个出现的值，并从数据子集中返回（有条件的lead/lag） _编程开发

按组返回下一个出现的值，并从数据子集中返回（有条件的lead/lag）

创始人

2024-09-02 21:05:40

0次

我们可以使用dplyr包中的lead和lag函数来实现此目的。

例如，假设我们有一个数据集“df”，其中有两列“group”和“value”。我们想按组返回“value”的下一个出现值，并且该值必须满足某些条件。

下面是一个示例代码：

library(dplyr)

# 创建一个示例数据集
df <- data.frame(group = c(1, 1, 1, 2, 2, 2),
                 value = c(10, 20, 30, 100, 200, 300))

# 按组返回下一个出现的值，并从数据子集中返回（有条件的lead/lag）
df %>%
  group_by(group) %>%
  mutate(next_value = lead(value),
         next_value_subset = ifelse(next_value > 100, next_value, NA))

上面的代码将数据集按“group”分组，并在每个组中为“value”列创建两个新列：“next_value”和“next_value_subset”。

“next_value”列包含组内“value”列的下一个值。如果在组中的最后一个行中没有下一个值，则“next_value”列中的值将为NA。

“next_value_subset”列是“next_value”列的子集。它仅包含大于100的“next_value”值。如果“next_value”小于或等于100，则“next_value_subset”列中的值将为NA。

上述代码中使用了ifelse函数来实现子集条件过滤。该函数的语法为：

ifelse(condition, true_value, false_value)

如果“condition”评估为TRUE，则返回“true_value”，否则返回“false_value”。

在这个示例中，我们使用了ifelse函数来检查“next_value”是否大于100。如果是，则返回“next_value”，否则返回NA。

上一篇：按组返回日期范围

下一篇：按组返回长度总结

按组返回下一个出现的值，并从数据子集中返回（有条件的lead/lag）

相关内容

热门资讯