我们可以先按照personId进行分组,然后对每组数据进行相对频率的计算。示例如下:
import pandas as pd
# 假设数据存储在一个dataframe中,包含personId和value两列
data = pd.read_csv('data.csv')
# 按照personId进行分组,并计算每个分组内value的出现次数
grouped = data.groupby('personId').apply(lambda x: x['value'].value_counts())
# 对每个分组内的value出现次数进行相对频率的计算
relative_freq = grouped / grouped.sum()
# 将结果输出为一个新的csv文件
relative_freq.to_csv('relative_freq_by_personId.csv')
这样,我们就可以得到按照personId计算出来的每个value的相对频率了。
上一篇:按照配料筛选披萨
下一篇:按照评分和日期的组合进行条目排序