下面是一个使用Python和pandas库比较两个表格的相应列的匹配值,并识别缺失记录的示例代码:
import pandas as pd
# 读取两个表格
df1 = pd.read_csv('table1.csv')
df2 = pd.read_csv('table2.csv')
# 比较相应列的匹配值
merged = pd.merge(df1, df2, on='column_name', how='outer')
# 标记缺失记录
merged['is_missing'] = merged['column_name_y'].isnull()
# 输出结果
print(merged)
在这个示例中,我们首先使用pandas
库的read_csv
函数读取了两个表格(table1.csv
和table2.csv
)。然后,我们使用merge
函数将两个表格按照指定的列(column_name
)进行合并,使用outer
方式表示保留所有记录。
接下来,我们创建了一个新的列(is_missing
),通过检查column_name_y
列是否为空来标记缺失记录。最后,我们打印了合并后的表格,其中包含了匹配值和是否缺失的标记。
请注意,你需要将代码中的column_name
替换为实际需要比较的列名,同时将table1.csv
和table2.csv
替换为实际的表格文件路径。