在R语言中,我们可以使用许多方法来按列进行data.frame的操作。以下是一些常见的方法和示例代码:
data$column_name
data[["column_name"]]
data[, c("column_name1", "column_name2")]
data[, -c(1, 3)]
data$column_name <- new_column
data[["new_column"]] <- new_column
data[, "new_column"] <- new_column
data$column_name <- NULL
data[, "column_name"] <- NULL
names(data)[old_column_index] <- "new_column_name"
colnames(data)[old_column_index] <- "new_column_name"
data[order(data$column_name), ]
apply(data, 2, mean)
sapply(data, sum)
其中,2代表按列(第1个参数是data),mean表示对每一列求平均值。
library(dplyr)
data2 <- data %>%
select(column_name1, column_name2) %>%
filter(column_name1 > 10) %>%
group_by(column_name2) %>%
summarise(avg_column_name1 = mean(column_name1))
其中,上述代码使用select()、filter()、