以下是一个示例代码,演示了如何按日期范围融合数据:
import pandas as pd
# 创建示例数据框
df1 = pd.DataFrame({
'日期': pd.date_range(start='2021-01-01', end='2021-01-10'),
'数值1': range(10)
})
df2 = pd.DataFrame({
'日期': pd.date_range(start='2021-01-05', end='2021-01-15'),
'数值2': range(11, 21)
})
# 将日期列设置为索引
df1.set_index('日期', inplace=True)
df2.set_index('日期', inplace=True)
# 使用concat函数按日期范围融合数据
merged_df = pd.concat([df1, df2], axis=1, join='outer')
# 打印结果
print(merged_df)
这段代码的输出结果如下:
数值1 数值2
2021-01-01 0.0 NaN
2021-01-02 1.0 NaN
2021-01-03 2.0 NaN
2021-01-04 3.0 NaN
2021-01-05 4.0 11.0
2021-01-06 5.0 12.0
2021-01-07 6.0 13.0
2021-01-08 7.0 14.0
2021-01-09 8.0 15.0
2021-01-10 9.0 16.0
2021-01-11 NaN 17.0
2021-01-12 NaN 18.0
2021-01-13 NaN 19.0
2021-01-14 NaN 20.0
2021-01-15 NaN 21.0
这段代码首先使用Pandas库创建了两个示例数据框df1和df2,其中包含了日期和数值列。然后,使用set_index
函数将日期列设置为索引。接下来,使用concat
函数按日期范围融合了两个数据框,设置了axis=1
表示按列融合,join='outer'
表示使用外连接方式,保留了所有的日期。
最后,将融合后的数据框打印出来,可以看到数据按日期范围融合了,并且缺失的数值使用NaN填充。
下一篇:按日期范围筛选的JSONAPI