要按pandas DataFrame中的重复值进行分组和计数,可以使用groupby()
和value_counts()
方法。以下是一个示例代码:
import pandas as pd
# 创建一个示例DataFrame
data = {'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar'],
'B': ['one', 'one', 'two', 'two', 'three', 'three'],
'C': [1, 2, 3, 4, 5, 6]}
df = pd.DataFrame(data)
# 按'A'列进行分组,并计算每组中的重复值计数
grouped = df.groupby('A')['B'].value_counts()
print(grouped)
输出结果为:
A B
bar two 2
one 1
foo three 1
two 1
one 1
这段代码首先创建了一个示例DataFrame,其中'A'列包含重复值。然后使用groupby()
方法按'A'列进行分组,并通过['B']
指定要计数的列。最后使用value_counts()
方法计算每组中的重复值计数,并将结果存储在变量grouped
中。最后,通过打印grouped
可以查看结果。