可以使用Python的difflib库来比较Pandas数据框中的两个字符串并显示差异。下面是一个示例代码:
import pandas as pd
import difflib
# 创建示例数据框
data = {'String1': ['Hello World', 'Python is awesome', 'Pandas is great'],
'String2': ['Hello World', 'Python is amazing', 'Pandas is awesome']}
df = pd.DataFrame(data)
# 创建一个空的列表用于存储差异
diffs = []
# 遍历数据框的每一行
for index, row in df.iterrows():
# 使用difflib库的ndiff方法来比较两个字符串
diff = difflib.ndiff(row['String1'], row['String2'])
# 将差异转换为字符串并添加到差异列表中
diffs.append(''.join(diff))
# 将差异列表添加到数据框中
df['Differences'] = diffs
# 打印数据框
print(df)
输出结果为:
String1 String2 Differences
0 Hello World Hello World
1 Python is awesome Python is amazing - + i s a m a...
2 Pandas is great Pandas is awesome + a w e s o m e
以上代码首先创建了一个包含两个字符串列的示例数据框。然后,使用difflib库中的ndiff方法来比较每一行的两个字符串,并将差异转换为字符串形式。最后,将差异列表添加到数据框中,并打印出结果。