以下是一个Python代码示例,展示了如何按照列的值进行分组:
import pandas as pd
# 创建示例数据
data = {'Name': ['John', 'Emma', 'Mike', 'John', 'Emma'],
'Age': [25, 30, 28, 25, 30],
'City': ['New York', 'London', 'Paris', 'New York', 'London'],
'Salary': [5000, 6000, 5500, 5000, 6000]}
df = pd.DataFrame(data)
# 按照 'City' 列的值进行分组
groups = df.groupby('City')
# 遍历每个分组并打印
for name, group in groups:
print("City:", name)
print(group)
print()
运行上述代码,将得到以下输出结果:
City: London
Name Age City Salary
1 Emma 30 London 6000
4 Emma 30 London 6000
City: New York
Name Age City Salary
0 John 25 New York 5000
3 John 25 New York 5000
City: Paris
Name Age City Salary
2 Mike 28 Paris 5500
代码中,我们首先创建了一个包含姓名、年龄、城市和工资的示例数据(存储在字典data
中),然后使用pd.DataFrame
函数将数据转换为一个DataFrame对象。
接下来,我们使用groupby
方法根据'City'列的值对DataFrame进行分组。这将返回一个分组对象,其中每个分组都可以通过遍历来访问。
最后,我们使用一个for循环遍历每个分组,并打印出分组的名称(即'City'列的值)以及该分组的内容。