可以使用Python中的pandas库来完成此问题。下面是代码示例:
import pandas as pd
def calc_mean(df, group_col, calc_col):
"""
计算指定列在分组后的均值,其中分组列由group_col指定,计算均值列由calc_col指定
"""
return df.groupby(group_col)[calc_col].mean()
# Example usage:
df = pd.DataFrame({
'fruit': ['apple', 'apple', 'banana', 'banana', 'kiwi'],
'price': [1.50, 1.75, 0.75, 0.80, 2.50],
})
print(calc_mean(df, 'fruit', 'price'))
在此示例中,calc_mean
函数将DataFrame和两个参数作为输入:group_col
和calc_col
。函数将DataFrame根据group_col
参数进行分组,并计算calc_col
列的均值。我们还使用了pandas提供的mean
函数来计算均值。最后,返回结果以便使用者操作。
在上面的示例中,函数将DataFrame按每种水果进行分组,然后计算价格的平均值。函数返回每个水果的平均价格。
此示例提供了一个泛化的解决方案,可以在更广泛的数据集上使用。如果需要执行其他计算,可以在函数中添加其他操作。