HLA分型算法(三)

HLALA & HLAPRG算法

这两种方法都可以在G-domain精度水平对HLA reads完成分型工作。由于HLA*LA是在HLA*PRG算法基础上改进的,所以这里先讲HLA*PRG的算法原理。

一、HLA*PRG的算法原理

  1. HLA基因PRG(Population Reference Graph)的构建
    利用IMGT/HLA数据库中46个HLA基因(涉及720条基因组序列、10050外显子序列和8个MHC单体型)构建了一个HLA参考图用于后续待分型reads的分型工作。不同基因间设定2000个”N“的填充作为基因边界。
  2. 多序列比对的合并

References:

  1. Dilthey AT, Gourraud P-A, Mentzer AJ, Cereb N, Iqbal Z, McVean G (2016) High-Accuracy HLA Type Inference from Whole-Genome Sequencing Data Using Population Reference Graphs. PLoS Comput Biol 12(10): e1005151.
  2. Alexander T Dilthey, Alexander J Mentzer, Raphael Carapito et al. HLA*LA—HLA typing from linearly projected graph alignments, Bioinformatics, Volume 35, Issue 21, 1 November 2019, Pages 4394–4396
赞赏