要按列连接CSV文件并包含来自文件名的时间戳,可以使用Python的pandas库来实现。下面是一个代码示例:
import pandas as pd
import os
# 获取指定目录下的所有CSV文件
directory = 'your_directory'
csv_files = [file for file in os.listdir(directory) if file.endswith('.csv')]
# 创建一个空的DataFrame用于存储连接后的数据
combined_data = pd.DataFrame()
# 遍历每个CSV文件
for file in csv_files:
# 从文件名中提取时间戳
timestamp = file.split('.')[0]
# 读取CSV文件并添加时间戳列
data = pd.read_csv(os.path.join(directory, file))
data['timestamp'] = timestamp
# 将当前文件的数据连接到combined_data中
combined_data = pd.concat([combined_data, data], axis=1)
# 保存连接后的数据到新的CSV文件
combined_data.to_csv('combined_data.csv', index=False)
在上面的代码中,你需要将your_directory
替换为包含CSV文件的目录的路径。代码首先获取目录中的所有CSV文件,然后遍历每个文件。在每个文件中,它从文件名中提取时间戳,并使用pd.read_csv
函数读取CSV数据。然后,在数据中添加一个名为"timestamp"的列,并将当前文件的数据连接到combined_data
中。最后,使用to_csv
方法将连接后的数据保存到新的CSV文件"combined_data.csv"中。
请确保安装了pandas库,可以使用以下命令安装:
pip install pandas