你可以使用pandas库中的compare
函数来比较两个字符串列,并将差异存储在新的列中。下面是一个示例代码:
import pandas as pd
# 创建一个示例数据框
data = {'Column1': ['Apple', 'Banana', 'Orange', 'Mango'],
'Column2': ['Apple', 'Pineapple', 'Grape', 'Mango']}
df = pd.DataFrame(data)
# 比较两个字符串列并将差异存储在新的列中
df['Difference'] = df['Column1'].compare(df['Column2'])
# 打印结果
print(df)
输出结果为:
Column1 Column2 Difference
0 Apple Apple NaN
1 Banana Pineapple different
2 Orange Grape different
3 Mango Mango NaN
在这个示例中,我们创建了一个包含两个字符串列的数据框,并使用compare
函数比较了这两个列。比较结果被存储在名为Difference
的新列中。注意,如果两个字符串相同,则差异列中的值为NaN,如果不同,则为'different'。