几乎每个人出生时都携带有50—100个父母没有的突变,这导致了个体之间巨大的基因差异。对医生来说,对某个病人的基因组进行测序以找出《投大小单双的平台》病因极具挑战性,因为可能有成千上万个突变与这种疾病有关。“阿尔法错义”应运而生,旨在预测这些基因突变是否有害。
由于碱基置换,与某一氨基酸相对应的密码子变成其他氨基酸的密码子,其结果使合成的蛋白质的活性发生变化或失去活性,这样的突变称为错义突变。每人体内平均携带约9000个错义突变,但在所有可能发生的7100万个错义突变中,科学家只确定了其中0.1%的错义突变的影响。
“阿尔法错义”并非要厘清错义突变如何改变蛋白质的结构或稳定性,以及与其他蛋白质之间的相互作用。相反,它会将每种可能的突变蛋白质的序列与“阿尔法折叠”(AlphaFold)训练过的蛋白质的序列进行比较,查看它看起来是否“自然”,看起来“不自然”的蛋白质会被评为潜在有害。