下面是一个Python示例代码,可以实现将原始CSV文件按照指定的列和筛选条件进行筛选,并生成新的CSV文件。
import pandas as pd
# 指定需要保留的列和关键词
selected_columns = ['id', 'name', 'age', 'gender']
keywords = ['female', '25-30']
# 读取原始CSV文件
df = pd.read_csv("original.csv")
# 根据指定的列和关键词筛选数据
df_filtered = df.loc[df['gender'].isin(keywords) & df['age'].between(25, 30), selected_columns]
# 将筛选后的数据写入新的CSV文件
df_filtered.to_csv("filtered.csv", index=False)
在上面的代码中,我们首先指定需要保留的列和关键词,在这个例子中是'gender'和'age'列上的关键词"female"和年龄在25到30岁之间的人。然后,我们使用pandas读取原始CSV文件,并使用.loc函数根据关键词和年龄范围筛选数据。最后,我们将筛选后的数据写入新的CSV文件filtered.csv。
需要注意的是,该代码中使用的是pandas库,因此需要先安装pandas库。可以使用以下命令来安装pandas:
pip install pandas