人工智能在DNA中显示“深色物体”

作者: 365bet体育 分类: 科技 发布时间: 2025-07-04 09:27
◎记者Zhang Jiaxin于2003年的《科学家》首次遵守人类基因组,宣布所有构成我们生活中“蓝图”的DNA追随者。尽管98%的基因组并未直接专用蛋白质,但它们仍然深深影响基因调节和细胞功能。这些非编码区域曾经考虑过“垃圾DNA”,但现在被认为包含重要的生物学秘密,例如遗传世界中的“黑暗事物”。今年6月25日,一个深刻的想法宣布,他们开发了一种名为Alphagenome的人工智能模型(AI),预计将在破译这个“深色物体”中取得突破。 《自然杂志》报道说,“谴责 - 遵循”模型可以预测一系列分子过程中bahdna变化的影响,从而提供了读取人类基因调节机制的新途径。 “集成”工具,解释了DNA序列,深刻的思想,由“ Alphafold启动2“ 2020年,成功地破解了科学界已经发生了数十年的问题:如何基于蛋白质的氨基酸顺序准确预测三维结构。这种突破不仅改变了结构生物学的研究方法,而且改变了新的研究和药物开发的过程。 相反,了解DNA的功能更为复杂,因为它没有像蛋白质那样具体的“正确答案”。这些功能主要反映在对DNA基因的明确调节中,例如确定何时关闭或关闭基因,细胞具有纸张以及表达的强度。如果蛋白质结构的预测是沿海沿岸“部分”的三维模型,那么DNA功能的DNA功能是了解每个符号的真实含义,注释,开关命令甚至手册中的“暗对象”区域。信息的水平所涉及的物质更为复杂,并且具有更广泛的关联,并且相同的DNA片段可以在不同的时间和不同类型的细胞中起不同的作用,因此建模比蛋白质更困难。几十年来,生物学家一直试图使用不同的计算工具来揭示DNA调节的复杂和秘密机制,但是这些模型倾向于集中于单个PAG-ANDAR。科学家们渴望使用“综合”工具来照亮DNA的依从性,因此“ alpha基因组”已经存在。根据美国Fun Engineering网站的说法,与以前的模型不同,该模型需要在“序列长度”和“预言精度”之间进行权衡,“ Alpha Genome”也取得了相同的成就。它不仅会获得远程基因组上下文信息,而且还提供了准确的基本水平预测,生物学疾病领域的研究视野的扩展,稀有变体研究,合成DNA设计等。根据深思熟虑的官方网站,MODEL可以在一个小时内处理多达100万对碱基,并预测一千个时间对,并预测和预测一次性分子特征,以及基因的表达,分裂模式,蛋白质结合位点,A。不同的MGA不同类型的细胞的职业。这是AI系统首次成为广泛监管特征的联合模型。用于“ Alpha基因组”训练的数据集来自许多可用的Hyperscale数据源。令人惊讶的是,完整模型的培训仅需4个小时,计算资源只是上一代模型的一半。在26个基准测试中,其中24个表现要比专用模型更好或更平坦。新模型的亮点是变体标记系统,它可以很好地比较突变前后的DNA依从性,并评估其对许多生物途径的影响。 “ alpha基因组”还具有分裂位点的操作,这是第一次可以预测与疾病(例如囊性纤维化和脊柱肌肉萎缩)相关的AbnorsRNA殿堂的模型。在合成生物学领域,“α基因组”可用于设计特定的法规,例如仅在神经细胞中激活某些基因,同时使它们平静为肌肉细胞。同时,预计还将使用具有强大生物学作用的稀有遗传变异,例如导致门德尔遗传疾病的突变。在验证中,研究人员将“α基因组”应用于先前研究中发现的特定白血病相关突变。结果,该模型准确地预测某些非编码区域变体不会直接激活相邻的TAL1致癌代,该机制被称为T细胞慢性淋巴细胞白血病中称为致病过程。 Themodel尚不适用于个人诊断。尽管“ alpha基因组”的表现令人赞叹,但深思熟虑的团队说有still系统的许多局限性。它不是为单个基因组解释而设计的,也不是为祖先(例如23andMe或临床遗传检查)预测疾病或信息的风险。也就是说,该模型不适合个人诊断或医疗决策。当前的“α基因组”训练数据仅限于人类和大鼠,并且尚未覆盖其他物种,其跨物种的灵活性仍有待证明。同时,确定调节元件与目标目标(超过100,000个基碱)之间关系的能力仍然很弱,并且不是不同状态和组织中细胞动态调节机制的完全模型。彼得·库(Peter Ku)是美国冷春港实验室中的一名计算生物学家,他指出:“这些模型通常在固定状态下受过训练,但现实中的细胞是动态的,蛋白质水平,DNA化学变化,转录状态等。紧随其后。 “因此,未来的模型需要将更多的“多模式”和“多时间尺度”因素引入更现实的模拟生物学过程。

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!