要按照数据框中多个变量的记录数量过滤变量,可以使用以下方法:
import pandas as pd
# 创建示例数据框
data = {'A': [1, 1, 2, 2, 3],
'B': [1, 2, 3, 4, 5],
'C': [1, 1, 1, 2, 2]}
df = pd.DataFrame(data)
# 按照A和C列的记录数量过滤B列
filtered_df = df.groupby(['A', 'C']).filter(lambda x: len(x) > 1)
import pandas as pd
# 创建示例数据框
data = {'A': [1, 1, 2, 2, 3],
'B': [1, 2, 3, 4, 5],
'C': [1, 1, 1, 2, 2]}
df = pd.DataFrame(data)
# 计算A和C列的记录数量
counts = df['A'].value_counts()
counts += df['C'].value_counts()
# 过滤B列
filtered_df = df[df['B'].isin(counts[counts > 1].index)]
这两种方法都可以根据多个变量的记录数量来过滤数据框中的变量。