使用Pandas库将多个小文件合并为一个大文件
在ADX导出时,可能会遇到创建多个小文件的情况。这可能会导致文件过多而难以管理。下面是使用Python的Pandas库来合并多个小文件为一个大文件的示例代码:
import pandas as pd
import glob
# 获取所有小文件的路径
path = "path/to/files/*"
all_files = glob.glob(path)
# 将多个小文件读入Pandas DataFrame
dfs = []
for filename in all_files:
dfs.append(pd.read_csv(filename))
# 将所有数据拼接成一个DataFrame
big_df = pd.concat(dfs, ignore_index=True)
# 将所有数据保存到一个大文件中
big_df.to_csv("path/to/output_file.csv", index=False)
以上代码将多个CSV文件合并为一个大文件,并将其保存为CSV格式的文件。可以根据需要更改文件路径和文件格式。
上一篇:ADX导出可能出现缓冲问题