要按列过滤和随机化Pandas数据框,可以使用pandas.DataFrame.filter()
函数和pandas.DataFrame.sample()
函数。
下面是一个示例代码,演示了如何按列过滤和随机化Pandas数据框:
import pandas as pd
# 创建一个示例数据框
data = {'A': [1, 2, 3, 4, 5],
'B': [6, 7, 8, 9, 10],
'C': [11, 12, 13, 14, 15]}
df = pd.DataFrame(data)
# 按列过滤
filtered_df = df.filter(['A', 'C'])
print(filtered_df)
# 输出:
# A C
# 0 1 11
# 1 2 12
# 2 3 13
# 3 4 14
# 4 5 15
# 随机化数据框
randomized_df = df.sample(frac=1) # frac=1表示将整个数据框随机化
print(randomized_df)
# 输出类似于以下内容,但顺序可能会不同:
# A B C
# 3 4 9 14
# 4 5 10 15
# 0 1 6 11
# 1 2 7 12
# 2 3 8 13
在上面的示例中,filter()
函数用于按列过滤数据框,sample()
函数用于随机化数据框。
下一篇:按列过滤数据框