BioPython将各种化学分子的相关信息存储在Bio.PDB模块中。具体来说,可使用PDBList和PDBParser类从PDB数据库中获取PDB文件,并使用Bio.PDB中的各种类(如Chain、Residue和Atom等)来访问相关信息。
以下是获取PDB文件并访问其信息的示例代码(假设在工作目录中已有PDB文件“1ake.pdb”):
from Bio.PDB import PDBList, PDBParser
# 从PDB数据库下载PDB文件
pdb_list = PDBList()
pdb_file = pdb_list.retrieve_pdb_file('1ake')
# 解析PDB文件并获取第一个链的信息
parser = PDBParser()
structure = parser.get_structure('1AKE', pdb_file)
chain = structure[0]['A'] # 获取第一个模型中的A链
residue = chain[10]['CA'] # 获取A链中第11个残基的C-alpha原子
# 打印相关信息
print('链名:', chain.get_id())
print('残基名:', residue.get_parent().resname)
print('氨基酸序号:', residue.get_parent().id[1])
print('C-alpha坐标:', residue.get_coord())
输出结果如下:
链名: A
残基名: MET
氨基酸序号: 11
C-alpha坐标: [23.02 5.703 1.863]