要按多列和自定义顺序对DataFrame进行排序,可以使用pandas库的sort_values()函数。以下是一个代码示例:
import pandas as pd
# 创建示例DataFrame
data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'Nick'],
'Age': [25, 30, 18, 35, 28],
'Salary': [5000, 6000, 4000, 5500, 4500]}
df = pd.DataFrame(data)
# 按照多列和自定义顺序排序
sort_order = ['Name', 'Age', 'Salary'] # 自定义排序顺序
df_sorted = df.sort_values(by=sort_order)
print(df_sorted)
输出结果为:
Name Age Salary
2 John 18 4000
4 Nick 28 4500
1 Nick 30 6000
0 Tom 25 5000
3 Tom 35 5500
在上述示例中,我们首先创建了一个包含姓名、年龄和薪水的DataFrame。然后,我们定义了自定义的排序顺序为['Name', 'Age', 'Salary']。最后,我们使用sort_values()函数按照指定的排序顺序对DataFrame进行排序,并将结果存储在df_sorted中。最后,我们打印出排序后的DataFrame。
上一篇:按多列分组,所有计数为0。