方林、王新雷、赖忠源、张东东、吴孟曲、潘志瑞、王丽、唐坤、钱大红、黄振德、王旭东、陈海波
二维细胞自动机 (CA) 图片是描绘核苷酸和氨基酸序列的另一种方法。本文表明,二维 CA 图片可以生动地描绘出 COVID-19 大流行的病原体 SARS-CoV-2 的基因和基因组的核苷酸序列 (碱基序列)。如果严格遵循遗传密码子规则,CA 图片还可以描绘遗传密码子并间接表达 SARS-CoV-2 蛋白质的氨基酸序列。CA 图片可以揭示核苷酸或氨基酸序列之间的整体和细节差异,并且对序列细节非常敏感,例如宿主蛋白酶 (如 TMPRSS2) 的切割识别位点和 SARS-CoV-2 刺突蛋白的受体结合结构域 (RBD),它们对来自不同 SARS-CoV2 毒株的序列之间只有一个氨基酸或核苷酸的变化都很敏感。我们认为CA图可以为病毒遗传和氨基酸序列信息提供数学基础,或者在表达SARS-CoV2和其他病毒的遗传信息时应用于人工智能。