以下是一个使用Pandas库的示例代码,可以按多列分组并获取每个组的前n行。
import pandas as pd
# 创建一个示例数据集
data = {'Group': ['A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
'Category': ['X', 'Y', 'X', 'Y', 'X', 'Z', 'X', 'Z', 'Z'],
'Value': [1, 2, 3, 4, 5, 6, 7, 8, 9]}
df = pd.DataFrame(data)
# 按多列分组并获取每个组的前n行
n = 2 # 前n行
result = df.groupby(['Group', 'Category']).head(n)
print(result)
输出结果为:
Group Category Value
0 A X 1
1 A Y 2
3 B Y 4
4 B X 5
6 C X 7
7 C Z 8
在示例中,我们首先创建了一个示例数据集df,其中包含三列('Group','Category','Value')。然后,我们使用groupby()方法按两列('Group'和'Category')进行分组,并使用head()方法获取每个组的前两行。最后,我们将结果打印出来。
您可以根据自己的需求修改示例代码中的数据集和n的值。
上一篇:按多列分组和聚合大数据集
下一篇:按多列分组问题