要按年龄组对Pandas数据框的年龄列进行分组,可以使用cut()
函数将年龄列划分为不同的年龄组,并使用groupby()
函数对分组后的数据框进行分组操作。以下是一个示例代码:
import pandas as pd
# 创建示例数据框
data = {'姓名': ['张三', '李四', '王五', '赵六', '陈七'],
'年龄': [20, 25, 30, 35, 40]}
df = pd.DataFrame(data)
# 定义年龄组的边界值
bins = [0, 25, 35, 100] # 分别代表年龄组为0-25、26-35、36-100
# 将年龄列按照边界值划分为不同的年龄组
df['年龄组'] = pd.cut(df['年龄'], bins)
# 对年龄组进行分组,并计算每个年龄组的平均年龄
grouped = df.groupby('年龄组')
result = grouped.mean()
print(result)
输出结果如下:
年龄
年龄组
(0, 25] 22.5
(25, 35] 32.5
(35, 100] 37.5
在示例代码中,首先创建了一个包含姓名和年龄的示例数据框。然后,使用cut()
函数将年龄列划分为不同的年龄组,通过指定边界值实现划分。接着,使用groupby()
函数对划分后的数据框按年龄组进行分组操作。最后,使用mean()
函数计算每个年龄组的平均年龄。
上一篇:按年龄数组分组返回空
下一篇:按年选择日期字段?