您可以使用pandas
库的groupby
和value_counts
方法来实现按多个列分组的百分比计数。
以下是一个示例代码,演示了如何使用groupby
和value_counts
方法来计算按多个列分组的百分比计数:
import pandas as pd
# 创建示例数据框
data = {'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
'B': ['one', 'one', 'two', 'two', 'two', 'one', 'two', 'one'],
'C': ['x', 'y', 'x', 'y', 'x', 'y', 'x', 'y']}
df = pd.DataFrame(data)
# 按多个列分组并计算百分比计数
grouped = df.groupby(['A', 'B']).size().reset_index(name='count')
grouped['percent'] = grouped['count'] / grouped['count'].sum() * 100
print(grouped)
输出结果如下:
A B count percent
0 bar one 1 12.500000
1 bar two 2 25.000000
2 foo one 2 25.000000
3 foo two 3 37.500000
在这个示例中,我们首先使用groupby
方法按列"A"和列"B"进行分组。然后使用size
方法计算每个组的计数,并使用reset_index
方法将结果转换为数据框。接下来,我们计算百分比计数,即将计数除以总计数并乘以100。最后,我们将百分比计数添加到数据框中并打印结果。
请根据您的具体数据和要求进行相应的调整和修改。