假设有一个dataframe,其中包含两列,列名分别为column1和column2,我们要按照column1列分组,计算column2列的平均值,并返回最大值。
代码示例:
import pandas as pd
# 创建一个示例dataframe
df = pd.DataFrame({'column1': [1, 1, 2, 2], 'column2': [4, 5, 6, 7]})
# 按照column1列分组,计算column2列的平均值,并返回最大值
max_mean = df.groupby(['column1'])['column2'].mean().max()
print(max_mean)
运行结果为:
6.5
解释:首先我们使用groupby函数按照column1列分组,然后使用['column2']选取column2列,并计算平均值。最后使用max函数返回最大值。