在Python中,可以使用pandas库来进行按多列排序和分组。
首先,导入pandas库:
import pandas as pd
然后,创建一个DataFrame对象:
data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'John'],
'Age': [20, 21, 22, 20, 22],
'City': ['London', 'Paris', 'New York', 'London', 'Paris']}
df = pd.DataFrame(data)
现在,可以使用sort_values()方法按多列进行排序,可以传入一个列名的列表,按顺序指定多个列进行排序:
df_sorted = df.sort_values(['Name', 'Age'])
接下来,可以使用groupby()方法按多列进行分组,同样可以传入一个列名的列表,按顺序指定多个列进行分组:
df_grouped = df_sorted.groupby(['Name', 'Age']).size().reset_index().rename(columns={0: 'Count'})
在这个示例中,首先按Name列进行排序,然后按Age列进行排序。然后,按Name和Age列进行分组,并计算每个组的数量。
最后,可以打印排序后的DataFrame和分组后的DataFrame:
print(df_sorted)
print(df_grouped)
完整的代码示例如下:
import pandas as pd
data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'John'],
'Age': [20, 21, 22, 20, 22],
'City': ['London', 'Paris', 'New York', 'London', 'Paris']}
df = pd.DataFrame(data)
df_sorted = df.sort_values(['Name', 'Age'])
df_grouped = df_sorted.groupby(['Name', 'Age']).size().reset_index().rename(columns={0: 'Count'})
print(df_sorted)
print(df_grouped)
这样,就可以按多列进行排序和分组了。
上一篇:按多列进行分组和求和