以下是一个示例代码,用于比较多个数据框中的数据帧以筛选数据并提取相关特征:
import pandas as pd
# 创建示例数据框
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [4, 5, 6], 'B': [7, 8, 9]})
df3 = pd.DataFrame({'A': [7, 8, 9], 'B': [10, 11, 12]})
# 将数据框存储在列表中
data_frames = [df1, df2, df3]
# 创建一个空的数据框,用于存储筛选后的数据
filtered_data = pd.DataFrame()
# 遍历数据框列表
for df in data_frames:
# 根据筛选条件选择特定的数据
filtered_df = df[df['A'] > 2]
# 将筛选后的数据添加到结果数据框中
filtered_data = filtered_data.append(filtered_df)
# 提取相关特征
mean_value = filtered_data['B'].mean()
max_value = filtered_data['B'].max()
min_value = filtered_data['B'].min()
# 打印结果
print("平均值: ", mean_value)
print("最大值: ", max_value)
print("最小值: ", min_value)
以上代码中,首先创建了三个示例数据框df1、df2和df3,并将它们存储在一个列表中。然后,通过遍历数据框列表,根据筛选条件选择特定的数据,并将其添加到结果数据框filtered_data中。最后,使用filtered_data数据框提取相关特征,如平均值、最大值和最小值,并将结果打印出来。根据实际需求,您可以根据需要修改代码。