在Python中,你可以使用pandas库来比较两列并保留NaN值。下面是一个示例代码:
import pandas as pd
# 创建示例数据
data = {'A': [1, 2, 3, 4, 5],
'B': [2, 4, 6, 8, 10]}
df = pd.DataFrame(data)
# 使用np.nan进行比较并保留NaN值
df['C'] = df['A'].where(df['A'] == df['B'], other=pd.np.nan)
print(df)
输出结果:
A B C
0 1 2 NaN
1 2 4 NaN
2 3 6 NaN
3 4 8 NaN
4 5 10 NaN
在上面的代码中,我们使用了where()
函数来比较两列A和B。如果两列的值相等,则将A列的值保留在新的列C中;如果不相等,则将NaN值填充到新的列C中。最后,我们打印出DataFrame来查看结果。
请注意,在示例代码中,我们使用了pd.np.nan
来表示NaN值,所以我们需要先导入pandas库中的np模块。
下一篇:比较两列并标记关联列中的差异