下面是一个示例代码,展示如何使用pandas库中的groupby函数按列表分组数据帧:
import pandas as pd
# 创建一个示例数据帧
data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'John'],
'Age': [28, 22, 25, 28, 25],
'City': ['New York', 'Paris', 'London', 'New York', 'London']}
df = pd.DataFrame(data)
# 按照Name分组,并计算每个组的平均年龄
grouped = df.groupby('Name')
avg_age = grouped['Age'].mean()
print(avg_age)
# 输出结果:
# Name
# John 25.0
# Nick 22.0
# Tom 28.0
# Name: Age, dtype: float64
在这个示例中,我们首先创建了一个包含姓名、年龄和城市的数据字典,并将其转换为数据帧。然后,我们使用groupby函数将数据帧按照姓名分组。接下来,我们通过指定要聚合的列名(Age)来计算每个组的平均年龄,并将结果存储在avg_age变量中。最后,我们打印出平均年龄的结果。
你可以根据自己的需求调整示例代码中的分组列和聚合列。
上一篇:按列表分组