按组返回下一个出现的值,并从数据子集中返回(有条件的lead/lag)
创始人
2024-09-02 21:05:40
0

我们可以使用dplyr包中的lead和lag函数来实现此目的。

例如,假设我们有一个数据集“df”,其中有两列“group”和“value”。我们想按组返回“value”的下一个出现值,并且该值必须满足某些条件。

下面是一个示例代码:

library(dplyr)

# 创建一个示例数据集
df <- data.frame(group = c(1, 1, 1, 2, 2, 2),
                 value = c(10, 20, 30, 100, 200, 300))

# 按组返回下一个出现的值,并从数据子集中返回(有条件的lead/lag)
df %>%
  group_by(group) %>%
  mutate(next_value = lead(value),
         next_value_subset = ifelse(next_value > 100, next_value, NA))

上面的代码将数据集按“group”分组,并在每个组中为“value”列创建两个新列:“next_value”和“next_value_subset”。

“next_value”列包含组内“value”列的下一个值。如果在组中的最后一个行中没有下一个值,则“next_value”列中的值将为NA。

“next_value_subset”列是“next_value”列的子集。它仅包含大于100的“next_value”值。如果“next_value”小于或等于100,则“next_value_subset”列中的值将为NA。

上述代码中使用了ifelse函数来实现子集条件过滤。该函数的语法为:

ifelse(condition, true_value, false_value)

如果“condition”评估为TRUE,则返回“true_value”,否则返回“false_value”。

在这个示例中,我们使用了ifelse函数来检查“next_value”是否大于100。如果是,则返回“next_value”,否则返回NA。

相关内容

热门资讯

安装apache-beam==... 出现此错误可能是因为用户的Python版本太低,而apache-beam==2.34.0需要更高的P...
避免在粘贴双引号时向VS 20... 在粘贴双引号时向VS 2022添加反斜杠的问题通常是由于编辑器的自动转义功能引起的。为了避免这个问题...
Android Recycle... 要在Android RecyclerView中实现滑动卡片效果,可以按照以下步骤进行操作:首先,在项...
omi系统和安卓系统哪个好,揭... OMI系统和安卓系统哪个好?这个问题就像是在问“苹果和橘子哪个更甜”,每个人都有自己的答案。今天,我...
原生ios和安卓系统,原生对比... 亲爱的读者们,你是否曾好奇过,为什么你的iPhone和安卓手机在操作体验上有着天壤之别?今天,就让我...
Android - 无法确定任... 这个错误通常发生在Android项目中,表示编译Debug版本的Java代码时出现了依赖关系问题。下...
Android - NDK 预... 在Android NDK的构建过程中,LOCAL_SRC_FILES只能包含一个项目。如果需要在ND...
Akka生成Actor问题 在Akka框架中,可以使用ActorSystem对象生成Actor。但是,当我们在Actor类中尝试...
Agora-RTC-React... 出现这个错误原因是因为在 React 组件中使用,import AgoraRTC from “ago...
Alertmanager在pr... 首先,在Prometheus配置文件中,确保Alertmanager URL已正确配置。例如:ale...