要按多个变量对数据框进行排序,可以使用pandas
库的sort_values()
方法。下面是一个示例代码:
import pandas as pd
# 创建示例数据框
data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'John'],
'Age': [28, 32, 25, 30, 35],
'Height': [175, 180, 170, 172, 168]}
df = pd.DataFrame(data)
# 按多个变量对数据框进行排序
df_sorted = df.sort_values(by=['Name', 'Age'])
# 打印排序后的数据框
print(df_sorted)
输出结果:
Name Age Height
2 John 25 170
4 John 35 168
1 Nick 32 180
0 Tom 28 175
3 Tom 30 172
在上面的示例中,我们首先创建了一个包含姓名、年龄和身高的数据字典,并将其转换为数据框。然后,我们使用sort_values()
方法按姓名和年龄对数据框进行排序,通过by
参数指定排序的变量名。最后,我们打印出排序后的数据框。请注意,排序是按照指定的变量的顺序进行的,先按姓名排序,再按年龄排序。
上一篇:按多个变量对列表进行排序
下一篇:按多个变量分组并总结dplyr