以下是一个使用Pandas库中的merge
函数来比较两个数据框并找到在第二个数据框中不存在的行的示例代码:
import pandas as pd
# 创建第一个数据框
df1 = pd.DataFrame({'col1': [1, 2, 3], 'col2': ['a', 'b', 'c']})
# 创建第二个数据框
df2 = pd.DataFrame({'col1': [2, 3, 4], 'col2': ['b', 'c', 'd']})
# 使用merge函数比较两个数据框
merged_df = pd.merge(df1, df2, on='col1', how='left')
# 找到在第二个数据框中不存在的行
nonexistent_rows = merged_df[merged_df['col2_y'].isnull()]
# 输出结果
print(nonexistent_rows)
运行以上代码,将输出在第二个数据框中不存在的行。这里使用了merge
函数将两个数据框按照col1
列进行比较,并使用左连接(how='left'
)保留第一个数据框的所有行。然后,通过筛选出col2_y
列中为空的行,即可找到在第二个数据框中不存在的行。