HHsuite 是一个高敏感度的序列同源性搜索和比对软件包,尤其适用于远程同源性检测。与传统比对工具不同,HHsuite 使用基于隐马尔可夫模型(Hidden Markov Model, HMM)的比对算法。HHsuite 中最常用的两个工具是 HHsearch 和 HHblits。
HHsuite 主要组件
- HHblits:快速、敏感的序列比对工具。HHblits 通过构建查询序列的 HMM profile 并与数据库中的 profile 进行比对,适合多重序列比对和检测较远的同源关系。
- HHsearch:基于 HMM-HMM 比对的同源性搜索工具。HHsearch 使用预先计算好的 HMM profile,适合结构预测和功能注释。
conda 安装
conda install -c bioconda hhsuite
数据库准备
HHsuite 的数据库通常是 HMM profile 库,如 UniProt、PDB70、Uniclust30。
从https://gwdu111.gwdg.de/~compbiol/uniclust/2018_08/ 下载uniclust30、uniclust50、uniclust90数据。
从 Index of /~compbiol/data/hhsuite/databases/hhsuite_dbs 下载pdb数据。
wget https://gwdu111.gwdg.de/~compbiol/uniclust/2018_08/uniclust30_2018_08_hhsuite.tar.gz
wget https://wwwuser.gwdguser.de/~compbiol/data/hhsuite/databases/hhsuit