CATH数据库提供了多种类型的数据供用户下载,涵盖了蛋白质的结构域分类、同源性分析、功能注释等方面。以下是CATH数据库提供的一些主要数据类型及其解释:
http://www.cathdb.info/download
1. 分类数据(Classification Data)
- 文件:如
cath-domain-list.txt - 内容:包含CATH数据库中所有蛋白质结构域的分类信息,按照CATH四级分类系统组织(Class、Architecture、Topology、Homologous superfamily)。
- 解释:每一行表示一个结构域的分类信息,包括PDB ID、链ID、CATH分类号(CATH四级编号),这些编号可以帮助用户了解每个结构域在CATH分类中的位置。
2. 非冗余数据集(Non-redundant Data Sets)
- 文件:如
cath-dataset-nonredundant-S40-v4_0_0.list













![CentOs7 解决yum更新源报错:[Errno 14] HTTP Error 404 - Not Found 正在尝试其它镜像。](https://i-blog.csdnimg.cn/direct/b55644a6a5b84e84862e6b3ba3f2d47e.png)






