可以使用Biopython Entrez提取全文并存储为本地文件,但要注意,每个PMC文章的大小有限制,不同的出版商文件大小限制可能不同。以下是一个简单的代码示例,该示例从PMID列表中提取3篇文章并存储在本地目录下。
from Bio import Entrez
import os
Entrez.email = "your_email@address.com" # 输入您的电子邮件地址(必需)
pmid_list = ['1234567', '2345678', '3456789']
output_dir = '/path/to/output/directory' # 输出目录
for pmid in pmid_list:
handle = Entrez.efetch(db="pubmed", id=pmid, rettype='full', retmode='xml')
article = handle.read()
# 存储全文到本地文件
output_file = os.path.join(output_dir, pmid + '.xml')
with open(output_file, 'w') as f:
f.write(article)
在上面的代码中,我们使用Entrez.efetch来提取每个PMID的全文,并将其存储为XML格式的本地文件。 可以更改输出目录和输出文件名,以根据需要修改默认路径和命名模式。