要比较两列的值并删除重复的 NaN 值,可以使用 Pandas 库中的 DataFrame
和 drop_duplicates()
函数。
下面是一个示例代码,演示了如何比较两列并删除重复的 NaN 值:
import pandas as pd
# 创建示例数据
data = {'列1': [1, 2, 3, 4, 5],
'列2': [1, 2, float('nan'), 4, float('nan')]}
df = pd.DataFrame(data)
# 比较两列的值并删除重复的 NaN 值
df['重复'] = df.duplicated(subset=['列1', '列2'])
df = df.drop_duplicates(subset=['列1', '列2'], keep=False).dropna()
# 打印结果
print(df)
这段代码首先使用 pd.DataFrame()
创建了一个包含两列的示例数据框。然后,duplicated()
函数用于比较两列的值,将重复的行标记为 True
,并将结果存储在新的列 '重复'
中。接下来,drop_duplicates()
函数用于删除重复的行,并使用 dropna()
函数删除包含 NaN 值的行。最后,使用 print()
函数打印结果。
运行这段代码,将得到一个删除了重复的 NaN 值的数据框。
下一篇:比较两列的最小值。