以下是一个示例代码,演示如何按时间范围将文件筛选到单个表中:
import pandas as pd
import glob
# 定义时间范围
start_date = '2022-01-01'
end_date = '2022-12-31'
# 获取所有文件路径
file_paths = glob.glob('path_to_folder/*.csv')
# 创建一个空的数据框
df = pd.DataFrame()
# 遍历文件路径
for file_path in file_paths:
# 读取CSV文件
temp_df = pd.read_csv(file_path)
# 将日期列转换为日期时间格式
temp_df['Date'] = pd.to_datetime(temp_df['Date'])
# 根据时间范围筛选数据
temp_df = temp_df[(temp_df['Date'] >= start_date) & (temp_df['Date'] <= end_date)]
# 将筛选后的数据添加到主数据框中
df = df.append(temp_df, ignore_index=True)
# 打印结果
print(df)
请注意,您需要将'path_to_folder'
替换为包含您要筛选的CSV文件的文件夹的实际路径。此代码假设所有CSV文件具有相同的列名,并且日期列名为'Date'
。如果您的实际数据与此不同,请相应地进行修改。
上一篇:按时间范围分组结果