假设我们有一个包含多个组的数据集,每个组中可能会有重复项。我们需要按组去除这些重复项,只保留每个组中的唯一项。
以下是解决该问题的代码示例:
import pandas as pd
# 创建一个包含多个组的数据集
data = {'group': ['A', 'B', 'B', 'C', 'C', 'C'], 'value': [1, 2, 2, 3, 3, 4]}
df = pd.DataFrame(data)
# 按组去除重复项
df.drop_duplicates(subset=['group', 'value'], inplace=True)
# 输出结果
print(df)
输出结果为:
group value
0 A 1
1 B 2
3 C 3
5 C 4
可以看到,我们成功地按组去除了重复项,并只保留了每个组中的唯一项。
上一篇:按组去除重复的年份行
下一篇:Anzure搜索摄取事件