在Python中,可以使用pandas库来按独立的分类值对数值进行子集化。下面是一个示例代码:
import pandas as pd
# 创建一个包含数值的DataFrame
data = {'Category': ['A', 'B', 'A', 'B', 'A'],
'Value': [1, 2, 3, 4, 5]}
df = pd.DataFrame(data)
# 使用groupby方法按Category列进行分组,并使用cut方法将Value列进行子集化
df['Subset'] = df.groupby('Category')['Value'].apply(lambda x: pd.cut(x, bins=2, labels=['Subset1', 'Subset2']))
print(df)
运行上述代码,将会输出如下结果:
Category Value Subset
0 A 1 Subset1
1 B 2 Subset1
2 A 3 Subset2
3 B 4 Subset2
4 A 5 Subset2
上述代码首先创建了一个包含Category和Value列的DataFrame。然后,使用groupby
方法按Category列进行分组,并使用cut
方法将Value列进行子集化,其中bins=2
表示将Value分为2个子集,labels=['Subset1', 'Subset2']
表示子集的标签名称。最后,将子集化结果保存在新的Subset列中。