欢迎关注我的CSDN:https://spike.blog.csdn.net/
本文地址:https://spike.blog.csdn.net/article/details/139419653
CASP16 的 H0215 样本,聚类之后,10个类别的最高置信度结果。
Agglomerative Clustering,即凝聚层次聚类,属于层次聚类算法,通过逐步合并或聚集数据点,构建嵌套的聚类。核心思想是将每个数据点视为一个单独的簇,然后,逐步合并最相似的簇,直到满足某种停止准则。这种相似性的度量通常基于距离或密度,例如欧几里得距离、余弦相似度等。该算法采用自底向上的方式构建聚类层次,将每个数据点作为单个聚类开始,然后,迭代合并最接近的聚类对,直到所有数据点合并为一个聚类,或直到达到指定的聚类数量为止。
在预测蛋白质结构的过程中,尤其是蛋白质复合物,其包括多种不同的构象,也需要不同的结构采样方式,这样,就需要选择出,结构有差异且又符合折叠原则的合适结构,作为蛋白质结构的候选,用于分析。例如在 CASP (Critical Assessment of Te