可以使用Python中的pandas库来解决这个问题。以下是一个示例代码:
import pandas as pd
# 读取两个文件并存储为pandas的DataFrame对象
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
# 使用merge函数将两个DataFrame对象按照某一列进行合并
merged_df = pd.merge(df1, df2, on='column_name')
# 提取出匹配的大型数据集
large_dataset = merged_df[merged_df['size'] >= 14]
# 将提取出的数据集保存为新的文件
large_dataset.to_csv('large_dataset.csv', index=False)
请确保将'file1.csv'和'file2.csv'替换为实际的文件路径,'column_name'替换为实际的列名,'size'替换为用于比较大小的列名。最后,将生成的大型数据集保存为'large_dataset.csv'。