首先,我们需要读取并加载数据集。假设数据集中包含“年份”、“客户姓名”、“销售金额”等属性。代码如下:
data <- read.csv("sales_data.csv")
接下来,我们可以使用dplyr包对数据进行排序和分组,然后使用top_n函数选择每年中的前N个记录。代码如下:
library(dplyr) topN <- function(data, N){ data %>% arrange(year, client_name, sales_amount) %>% group_by(year) %>% top_n(N, sales_amount) }
这个函数将数据按照年份和客户名称的顺序排序,然后在每个年份分组中选择前N个销售额最高的记录。
最后,我们可以使用该函数选择每年中前10个记录,并将结果保存在一个新的数据框中。代码如下:
result <- topN(data, 10)
这将返回一个数据框,其中包含每年中的前10个销售额最高的记录。
上一篇:按年份和会议分类的错误信息