假设有两个数据框df1和df2,它们按照ID列关联。其中df1包含完整的ID信息,而df2只包含部分ID信息。我们要将这两个数据框合并,并填充df2中缺失的值。可以采用以下方法:
# 导入pandas库并读取两个数据框
import pandas as pd
df1 = pd.read_csv('df1.csv')
df2 = pd.read_csv('df2.csv')
# 按照ID列进行关联,并合并两个数据框
df_merged = pd.merge(df1, df2, on='ID', how='left')
# 根据需要填充缺失值,比如用0填充
df_merged.fillna(0, inplace=True)
# 保存合并后的数据框
df_merged.to_csv('df_merged.csv', index=False)
上述代码首先导入pandas库并读取待处理的数据框。然后,使用pd.merge()
函数按照ID列关联,将两个数据框合并成一个。使用how
参数指定合并方式,这里采用左连接,即以df1为基准,保留其所有行,并用df2中对应的行填充缺失值。然后,使用fillna()
函数填充缺失值,这里用0进行填充。最后,将合并后的数据框保存到文件中。