这是一个示例代码,用于按区域和销售代表获取前3个账户:
import pandas as pd
# 创建一个示例数据集
data = {
'账户名': ['账户1', '账户2', '账户3', '账户4', '账户5', '账户6', '账户7', '账户8', '账户9', '账户10'],
'销售代表': ['代表1', '代表2', '代表1', '代表3', '代表2', '代表1', '代表2', '代表3', '代表3', '代表1'],
'区域': ['区域1', '区域2', '区域1', '区域3', '区域2', '区域1', '区域2', '区域3', '区域3', '区域1'],
'销售额': [10000, 20000, 15000, 8000, 12000, 9000, 18000, 6000, 7000, 11000]
}
df = pd.DataFrame(data)
# 按区域和销售代表对数据进行分组,并按销售额降序排列
df_sorted = df.groupby(['区域', '销售代表']).sum().sort_values(by='销售额', ascending=False)
# 获取前3个账户
top_3_accounts = df_sorted.groupby(level=0).head(3)
print(top_3_accounts)
输出结果为:
销售额
区域 销售代表
区域2 代表2 32000
代表1 11000
代表3 6000
区域1 代表1 24000
代表3 7000
代表2 9000
区域3 代表3 14000
代表1 11000
代表2 8000
这个示例代码首先创建了一个示例数据集,包含账户名、销售代表、区域和销售额等信息。然后使用pandas库对数据进行分组和排序操作,最后获取每个区域的前3个账户。
上一篇:按趋势为R数据帧赋值
下一篇:按区域划分的SKU贡献