当使用groupby()
函数时,可以通过传递第二个变量来指定要对其进行分组的列。以下是一个示例代码:
import pandas as pd
# 创建一个示例数据集
data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'Nick'],
'Age': [20, 25, 30, 35, 40],
'City': ['London', 'New York', 'Paris', 'London', 'New York']}
df = pd.DataFrame(data)
# 按Name和City进行分组并计算平均年龄
grouped = df.groupby(['Name', 'City'])['Age'].mean()
print(grouped)
输出结果:
Name City
John Paris 30
Nick New York 32.5
Tom London 27.5
Name: Age, dtype: float64
在上面的示例中,我们将Name
和City
列作为分组依据,并计算了每个组的平均年龄。