在Python中,可以使用pandas库来按列对数据进行分组。下面是一个示例代码:
import pandas as pd
# 创建示例数据
data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'John'],
'Age': [20, 21, 22, 20, 22],
'City': ['London', 'New York', 'Paris', 'London', 'Paris']}
df = pd.DataFrame(data)
# 按列对数据进行分组
grouped = df.groupby('City')
# 打印每个分组的内容
for name, group in grouped:
print(name)
print(group)
运行以上代码,输出结果如下:
London
Name Age City
0 Tom 20 London
3 Tom 20 London
New York
Name Age City
1 Nick 21 New York
Paris
Name Age City
2 John 22 Paris
4 John 22 Paris
在示例中,我们首先创建了一个包含姓名、年龄和城市的示例数据。然后,我们使用groupby()
方法将数据按照城市列进行分组。最后,我们通过遍历每个分组,并打印出每个分组的内容。