人工智能革命扫除蛋白质的蛋白质
发表时间:2025年04月10日浏览量:
人工智能(AI)被蛋白质研究工作打断,因为它将帮助研究人员可以轻松预测蛋白质的3D结构。相关的成就赢得了2024年诺贝尔化学奖。如今,AI是通过形成蛋白质的氨基酸阶鉴定蛋白质的深层蛋白质。 AI比传统方法快,还可以根据以前从未见过的蛋白质来帮助研究人员。遵循未知的蛋白质始终是医学诊断,环境研究和考古学的普遍挑战。最近,在发表在自然机器智能上的一项研究中,称为Instanova的蛋白质顺序可以鉴定出海水样品中微生物产生的伤口和未知蛋白质中的病原体蛋白。实际上,Instanova不是一个孤立的案例。在过去的四年中,研究人员推出了20多个基于蛋白质的蛋白质。威廉·诺布尔(William Noble)说:“这显然是该领域的方向。”美国华盛顿大学的ICS AI开发人员。蛋白质比DNA和RNA更复杂。人类基因组包含约20,000代,但这些Gen产生了1000万个不同的蛋白质。传统上,生物学家通过在诸如肽等短片段中破坏蛋白质来鉴定蛋白质。每个肽由5至20个氨基酸组成。研究人员使用质谱仪来测量这些短片段,将其重量与十二个数据库中良好的肽的重量相匹配,以确定其身份,然后将碎片沿完整分子沿着片段进行海岸。但是这种传统方法有一些问题。例如,现有数据库中不存在多达70%的质谱肽。丹麦技术大学的蛋白质组学专家蒂莫西·帕特里克·詹金斯(Timothy Patrick Jenkins)说:“传统的蛋白质组学就像使用搜索引擎搜索。如果不在数据库中,您将不会寻找它。”特别是当肽数据库续扩展,更长的时间以找到比赛。 AI将不难找到匹配的已知肽选择线。他们计算所有潜在的肽片段的重量,这些肽片段可以通过给定长度的肽的化学变化而产生。如果制作了将肽片段与实际样品匹配的片段,则Springsit将用全长蛋白收集它。为了提高准确性,蛋白培训的蛋白是根据数百万已知的肽以及如何聚集在良好的蛋白质中的。这使AI知道结合氨基酸链的最常见方法。詹金斯说,这种方法类似于大型语言模型,例如大量文本的chatgpt列车以找出语法政策,蛋白质组学AI学习了一种蛋白质的“语法”,该蛋白质提供了最可靠的谴责 - 在给定的肽范围内提供了最可靠的谴责。 2021年,Noble及其同事推出了Casanovo。这是第一个使用深神经网络的蛋白质阶AI。在2024年的纸上Noble团队以自然性质发表,报道说,AI在识别Newasunud方面已经很好地识别培训数据中未发现的肽。其他实验表明,Casanovo被充分鉴定出靶向免疫系统时靶向癌症以及海水样品中未知蛋白的细胞表面肽。由詹金斯(Jenkins)及其同事开发的Instanova基于深度神经网络的使用引入了扩散模型。这种方法也在诸如αFold之类的蛋白质结构模型中采用。在与卡萨诺沃(Casanovo)进行面对面测试中,Instanova伴随着升级的Instannova+,肽的42%被鉴定出9种生物的实验室蛋白质混合物。当詹金斯(Jenkins)的团队将Instanova应用于现实生活中的蛋白质组学试验中时,除其他结果外,它从感染的腿部伤口中鉴定出了针对人白蛋白的1,225肽,搜索了传统方法的10倍。其中254个是新肽n在数据库中找到的OT。其他领域的研究人员也将AI与蛋白质相关联。英国剑桥大学的蛋白质组学研究员马修·柯林斯(Matthew Collins)正在测试许多谴责蛋白AI工具研究考古样品的能力。 Collins的指出,在大多数情况下,样品中的蛋白质在漫长的地下时期会经过化学变化,或者它来自延长的动植物,因此在传统的蛋白质和肽数据库中不可能存在,这些AI模型特别适合在环境中发现蛋白质。使用AI工具,柯林斯团队在尼安德特的Sitese上发现了兔子蛋白质的特性。g。以及在巴西古锅中鱼肌蛋白的特性。