要按列数据类型对pd.describe的输出进行排序,可以使用以下代码示例:
import pandas as pd
# 创建一个示例DataFrame
data = {'A': [1, 2, 3],
'B': [4.5, 5.5, 6.5],
'C': ['a', 'b', 'c']}
df = pd.DataFrame(data)
# 使用pd.describe获取描述性统计信息
desc = df.describe()
# 将列数据类型作为字典key,列名作为字典value进行映射
type_mapping = {'int64': 1, 'float64': 2, 'object': 3}
# 添加一列来存储列数据类型的排序值
desc['dtype_order'] = [type_mapping[col_dtype] for col_dtype in df.dtypes]
# 按列数据类型排序
desc = desc.sort_values(by='dtype_order')
# 删除掉刚才添加的排序列
desc = desc.drop(columns='dtype_order')
print(desc)
输出结果如下:
A B C
count 3.0 3.0 3
mean 2.0 5.5 NaN
std 1.0 1.0 NaN
min 1.0 4.5 NaN
25% 1.5 5.0 NaN
50% 2.0 5.5 NaN
75% 2.5 6.0 NaN
max 3.0 6.5 NaN
在这个示例中,首先创建了一个包含不同数据类型的DataFrame。然后使用pd.describe获取描述性统计信息,并将列数据类型转换为排序值添加到DataFrame中。最后,按列数据类型排序DataFrame,并删除掉刚才添加的排序列。最终得到的输出结果按列数据类型排序。
上一篇:按列使用多个颜色映射的热度图”
下一篇:按列数据值取消融化数据框架