假设有以下数据集:
Name | Age | Gender |
---|---|---|
Tom | 24 | Male |
Alice | 35 | Female |
Bob | 18 | Male |
Chris | 28 | Male |
Lucy | 31 | Female |
John | 45 | Male |
Lily | 27 | Female |
我们要按性别分组,统计不同年龄的人数、最小年龄和最大年龄。
使用pandas库可以轻松完成此任务:
import pandas as pd
data = {
'Name': ['Tom', 'Alice', 'Bob', 'Chris', 'Lucy', 'John', 'Lily'],
'Age': [24, 35, 18, 28, 31, 45, 27],
'Gender': ['Male', 'Female', 'Male', 'Male', 'Female', 'Male', 'Female']
}
df = pd.DataFrame(data)
result = df.groupby('Gender').agg({'Age': ['count', 'min', 'max']})
print(result)
输出结果:
Age
count min max
Gender
Female 3 27 35
Male 4 18 45
可以看出,我们已经成功地按性别分组,并为不同年龄的人数、最小年龄和最大年龄分配了不同的聚合函数。