假设我们有一个DataFrame df,其中包含不同组的年份数据。我们可以使用groupby函数将数据按组分组,然后使用drop_duplicates函数去除重复年份行。下面是一个示例代码:
import pandas as pd
# 创建一个包含不同组的年份数据的DataFrame
data = {'Group': ['A', 'A', 'A', 'B', 'B', 'C'], 'Year': [2019, 2019, 2020, 2018, 2019, 2020]}
df = pd.DataFrame(data)
# 使用groupby函数按组分组,并使用drop_duplicates函数去除重复年份行
df.drop_duplicates(subset=['Group', 'Year'], keep='first', inplace=True)
这将创建一个无重复年份行的新DataFrame。我们可以使用print函数查看结果:
print(df)
输出:
Group Year
0 A 2019
2 A 2020
3 B 2018
4 B 2019
5 C 2020
上一篇:按组求和,并为每个组创建新变量
下一篇:按组去除重复项