import pandas as pd
# 创建示例数据
df = pd.DataFrame({
'姓名': ['小明', '小红', '小刚', '小明', '小刚'],
'年龄': [18, 20, 19, 18, 21],
'成绩': [70, 80, 85, 90, 95]
})
# 按姓名分组并返回成绩的最大值
result = df.groupby('姓名')['成绩'].max()
print(result)
输出结果:
姓名
小刚 95
小明 90
小红 80
Name: 成绩, dtype: int64
解释:上述代码使用 pandas 库中的 groupby 方法将 DataFrame 按照姓名这一列进行分组,然后对每个分组中的成绩这一列求最大值,并将结果存储到一个新的 Series 对象中。最后,通过打印输出结果可获得每个姓名对应的最大成绩。
上一篇:按列值分离数据集
下一篇:按列值分组并基于另一列值保留行