以下是一个示例代码,用于按另一个因素对因素的每个级别进行计数:
import pandas as pd
# 创建一个示例数据集
data = {'Factor1': ['A', 'A', 'B', 'B', 'B', 'C'],
'Factor2': ['X', 'Y', 'X', 'Y', 'Z', 'Z']}
df = pd.DataFrame(data)
# 按Factor1和Factor2进行分组,并计算每个组的计数
counts = df.groupby(['Factor1', 'Factor2']).size().reset_index(name='Count')
# 打印结果
print(counts)
输出结果为:
Factor1 Factor2 Count
0 A X 1
1 A Y 1
2 B X 1
3 B Y 1
4 B Z 1
5 C Z 1
这段代码首先创建了一个包含两个因素(Factor1和Factor2)的示例数据集。然后,使用groupby
函数对Factor1
和Factor2
进行分组,并使用size
函数计算每个组的计数。最后,通过reset_index
函数将结果转换为一个新的数据框,并添加一个名为Count
的列来存储计数信息。最终,使用print
语句打印计数结果。