在Python中,可以使用pandas库来按照列名称进行聚合操作。下面是一个示例代码:
import pandas as pd
# 创建一个示例数据集
data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'John'],
'Age': [20, 30, 25, 35, 40],
'City': ['New York', 'Los Angeles', 'Chicago', 'New York', 'Chicago']}
df = pd.DataFrame(data)
# 按照列名称进行聚合操作
aggregated_data = df.groupby('Name').agg({'Age': 'mean', 'City': 'first'})
print(aggregated_data)
输出结果为:
Age City
Name
John 32.5 Chicago
Nick 30.0 Los Angeles
Tom 27.5 New York
在上述示例中,我们使用了groupby
方法按照Name
列进行分组,并使用agg
方法进行聚合操作。agg
方法接受一个字典作为参数,其中键表示要聚合的列名,值表示要应用的聚合函数。在示例中,我们使用了mean
函数计算Age
列的平均值,并使用first
函数获取City
列的第一个值。最后,我们将聚合后的数据打印出来。
上一篇:按照列计算数量的百分比