以下是一个示例代码,演示如何按照所有列进行分组:
import pandas as pd
# 创建一个示例数据集
data = {'A': ['a', 'a', 'b', 'b'],
'B': ['c', 'd', 'c', 'd'],
'C': [1, 2, 3, 4]}
df = pd.DataFrame(data)
# 按所有列进行分组
grouped = df.groupby(df.columns.tolist())
# 遍历每个分组并打印
for name, group in grouped:
print(name)
print(group)
print()
运行以上代码,将会输出以下结果:
('a', 'c', 1)
A B C
0 a c 1
('a', 'd', 2)
A B C
1 a d 2
('b', 'c', 3)
A B C
2 b c 3
('b', 'd', 4)
A B C
3 b d 4
以上代码使用groupby
方法按照所有列进行分组。df.columns.tolist()
将所有列名转换为一个列表,作为groupby
方法的参数。此示例中,数据集的列名分别是'A'、'B'和'C'。遍历每个分组时,通过name
和group
分别获取分组的名字和数据。