下面是一个示例代码,用于按包含重复项的列进行分组,并保留重复信息:
import pandas as pd
# 创建一个示例数据集
data = {'Name': ['Alice', 'Bob', 'Charlie', 'Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35, 25, 30, 35],
'City': ['New York', 'Paris', 'London', 'New York', 'Paris', 'London']}
df = pd.DataFrame(data)
# 按包含重复项的列进行分组
groups = df.groupby(['Name', 'Age'])
# 打印每个分组的数据
for group, data in groups:
print(group)
print(data)
print('---------------------')
输出结果如下:
('Alice', 25)
Name Age City
0 Alice 25 New York
3 Alice 25 New York
---------------------
('Bob', 30)
Name Age City
1 Bob 30 Paris
4 Bob 30 Paris
---------------------
('Charlie', 35)
Name Age City
2 Charlie 35 London
5 Charlie 35 London
---------------------
以上代码使用pandas库创建一个示例数据集,并使用groupby方法按Name和Age列进行分组。然后,使用for循环遍历每个分组,并打印分组的内容。