以下是一个示例代码,演示了如何按每个记录进行分组并计算转换和连接列的唯一值计数:
import pandas as pd
# 创建示例数据
data = {'组': ['A', 'A', 'B', 'B', 'B', 'C'],
'转换列': [1, 2, 3, 4, 5, 6],
'连接列': ['X', 'Y', 'X', 'Y', 'Z', 'Z']}
df = pd.DataFrame(data)
# 对每个记录进行分组并计算唯一值计数
grouped = df.groupby('组').agg({'转换列': 'nunique', '连接列': 'nunique'})
# 打印结果
print(grouped)
输出结果如下:
转换列 连接列
组
A 2 2
B 3 3
C 1 1
在上述代码中,我们使用pandas
库创建了一个DataFrame
对象,并将它命名为df
。然后,我们使用groupby
函数根据"组"这一列进行分组。接下来,我们使用agg
函数来对分组后的数据进行聚合操作。通过agg
函数的参数,我们告诉它我们希望对"转换列"和"连接列"进行唯一值计数操作。最后,我们打印出分组后的结果。
请注意,上述示例中的数据是虚构的,你可以根据自己的实际需求进行修改。
上一篇:按每个季度的周分组日期