以下是一个示例代码,演示如何按日期筛选连接表:
import pandas as pd
# 创建第一个表
data1 = {'日期': ['2022-01-01', '2022-01-02', '2022-01-03'],
'数据1': [10, 20, 30]}
df1 = pd.DataFrame(data1)
# 创建第二个表
data2 = {'日期': ['2022-01-01', '2022-01-03', '2022-01-04'],
'数据2': [100, 200, 300]}
df2 = pd.DataFrame(data2)
# 将日期列转换为日期类型
df1['日期'] = pd.to_datetime(df1['日期'])
df2['日期'] = pd.to_datetime(df2['日期'])
# 按日期连接表
df_merged = pd.merge(df1, df2, on='日期', how='inner')
# 打印连接结果
print(df_merged)
运行上述代码,将会输出以下结果:
日期 数据1 数据2
0 2022-01-01 10 100
1 2022-01-03 30 200
在示例代码中,我们首先创建了两个表df1和df2。然后,我们使用pd.to_datetime()
函数将日期列转换为日期类型,以便可以按日期进行连接。
接下来,我们使用pd.merge()
函数按日期连接了df1和df2两个表,连接方式为内连接(inner join)。这意味着只有在两个表中都存在的日期才会被连接起来。
最后,我们打印出连接结果df_merged。它包含了在日期列上匹配的行的数据1和数据2列的值。
您可以根据您的具体需求进行修改和调整。