可以使用pandas库中的merge()函数,以多种方式比较不同大小的数据框。具体来说,可以使用以下几种方法:
df1 = pd.DataFrame({'key': ['foo', 'bar', 'baz', 'qux'], 'value': [1, 2, 3, 4]}) df2 = pd.DataFrame({'key': ['foo', 'baz', 'qux'], 'value': [5, 6, 7]}) merged_df = pd.merge(df1, df2, on='key', how='outer') print(merged_df)
merged_df.dropna(inplace=True) # 删除包含缺失值的行 merged_df.rename(columns={'value_x': 'df1_value', 'value_y': 'df2_value'}, inplace=True) # 重命名列名以匹配两个数据框
merged_df[(merged_df['df1_value'] > 1) & (merged_df['df2_value'] > 5)].sort_values(by='df1_value').groupby('key').size()
以上方法可根据具体情况选择,对于初学者来说也建议多尝试,以充分理解merge()函数的用法。