要按列的总和对数据框进行子集化,可以使用以下代码示例:
import pandas as pd
# 创建示例数据框
data = {'A': [1, 2, 3, 4],
        'B': [5, 6, 7, 8],
        'C': [9, 10, 11, 12]}
df = pd.DataFrame(data)
# 计算每列的总和
column_sums = df.sum()
# 按列的总和对数据框进行子集化
subset = df.loc[:, column_sums > 15]
# 输出结果
print(subset)
输出结果为:
   B   C
0  5   9
1  6  10
2  7  11
3  8  12
在上述代码中,首先我们创建了一个示例数据框df,然后使用sum()函数计算每列的总和并存储在column_sums变量中。接下来,我们使用布尔索引column_sums > 15来选择总和大于15的列,并使用loc函数对数据框进行子集化。最后,我们输出了子集化后的结果。
请注意,上述代码示例假设您已经安装了Pandas库。如果尚未安装,可以使用以下命令进行安装:
pip install pandas