以下是使用Python的pandas库来实现按多列值拆分csv文件并保留表头的示例代码:
import pandas as pd
# 读取原始csv文件
df = pd.read_csv('input.csv')
# 按多列值拆分为多个DataFrame
dfs = []
for group_name, group_data in df.groupby(['column1', 'column2']):
dfs.append(group_data)
# 保存拆分后的多个DataFrame为独立的csv文件
for i, group_df in enumerate(dfs):
group_df.to_csv(f'output_{i}.csv', index=False)
在上述代码中,假设原始csv文件的文件名为input.csv,要按多列值拆分的列名为column1和column2。首先,使用pandas的read_csv函数读取原始csv文件为一个DataFrame对象df。接下来,使用groupby函数根据列column1和column2的值将DataFrame拆分为多个子DataFrame,存储在列表dfs中。最后,使用to_csv函数将每个子DataFrame保存为独立的csv文件,文件名为output_0.csv、output_1.csv等。参数index=False表示不保留行索引。
上一篇:按多列筛选记录