要按列过滤和随机化Pandas数据框,可以使用pandas.DataFrame.filter()函数和pandas.DataFrame.sample()函数。
下面是一个示例代码,演示了如何按列过滤和随机化Pandas数据框:
import pandas as pd
# 创建一个示例数据框
data = {'A': [1, 2, 3, 4, 5],
        'B': [6, 7, 8, 9, 10],
        'C': [11, 12, 13, 14, 15]}
df = pd.DataFrame(data)
# 按列过滤
filtered_df = df.filter(['A', 'C'])
print(filtered_df)
# 输出:
#    A   C
# 0  1  11
# 1  2  12
# 2  3  13
# 3  4  14
# 4  5  15
# 随机化数据框
randomized_df = df.sample(frac=1)  # frac=1表示将整个数据框随机化
print(randomized_df)
# 输出类似于以下内容,但顺序可能会不同:
#    A   B   C
# 3  4   9  14
# 4  5  10  15
# 0  1   6  11
# 1  2   7  12
# 2  3   8  13
在上面的示例中,filter()函数用于按列过滤数据框,sample()函数用于随机化数据框。
下一篇:按列过滤数据框