要比较两个数据框中某一列的不同值,可以使用以下步骤来解决:
import pandas as pd
df1 = pd.DataFrame({'A': [1, 2, 3, 4, 5],
'B': ['a', 'b', 'c', 'd', 'e']})
df2 = pd.DataFrame({'A': [4, 5, 6, 7, 8],
'B': ['d', 'e', 'f', 'g', 'h']})
merged_df = pd.merge(df1, df2, on='B', how='outer')
在上面的代码中,我们将两个数据框按照列'B'进行合并,合并方式为'outer',表示保留两个数据框中的所有行。
different_values = merged_df[merged_df['A_x'].isnull() | merged_df['A_y'].isnull()]
在上面的代码中,我们使用isnull()函数检查'A_x'列和'A_y'列是否有缺失值,如果有缺失值则表示这些值在其中一个数据框中但不在另一个数据框中。
print(different_values)
完整的代码示例如下:
import pandas as pd
df1 = pd.DataFrame({'A': [1, 2, 3, 4, 5],
'B': ['a', 'b', 'c', 'd', 'e']})
df2 = pd.DataFrame({'A': [4, 5, 6, 7, 8],
'B': ['d', 'e', 'f', 'g', 'h']})
merged_df = pd.merge(df1, df2, on='B', how='outer')
different_values = merged_df[merged_df['A_x'].isnull() | merged_df['A_y'].isnull()]
print(different_values)
这样,你就可以比较两个数据框中某一列的不同值了。