以下是一个Python代码示例,展示了如何按照列的值进行分组:
import pandas as pd
# 创建示例数据
data = {'Name': ['John', 'Emma', 'Mike', 'John', 'Emma'],
        'Age': [25, 30, 28, 25, 30],
        'City': ['New York', 'London', 'Paris', 'New York', 'London'],
        'Salary': [5000, 6000, 5500, 5000, 6000]}
df = pd.DataFrame(data)
# 按照 'City' 列的值进行分组
groups = df.groupby('City')
# 遍历每个分组并打印
for name, group in groups:
    print("City:", name)
    print(group)
    print()
运行上述代码,将得到以下输出结果:
City: London
   Name  Age    City  Salary
1  Emma   30  London    6000
4  Emma   30  London    6000
City: New York
   Name  Age      City  Salary
0  John   25  New York    5000
3  John   25  New York    5000
City: Paris
   Name  Age   City  Salary
2  Mike   28  Paris    5500
代码中,我们首先创建了一个包含姓名、年龄、城市和工资的示例数据(存储在字典data中),然后使用pd.DataFrame函数将数据转换为一个DataFrame对象。
接下来,我们使用groupby方法根据'City'列的值对DataFrame进行分组。这将返回一个分组对象,其中每个分组都可以通过遍历来访问。
最后,我们使用一个for循环遍历每个分组,并打印出分组的名称(即'City'列的值)以及该分组的内容。