AI1.0与AI2.0制药技术及应用场景分析

AI1.0与AI2.0制药技术及应用场景分析

最佳答案 匿名用户编辑于2024/09/03 17:04

在 AI 驱动的药物开发领域,AI 1.0 和 AI 2.0 可以分别对应不同的技术和应用:

1. AI1.0 制药技术以及应用场景

AI 驱动的语言模型(LMs)在药物发现和开发过程初步展现了潜力。首先,这些模型 能够加速靶点识别过程,通过从科学文献和专利中提取与化学物质、基因、靶点和疾 病相关的信息来发现新的治疗靶点。其次,在临床试验阶段,语言模型可以优化患者 选择和招募,通过利用电子健康记录(EHRs)数据,提高患者筛选和匹配的效率,从 而改善临床试验设计和执行。 AI 驱动的语言模型还可以帮助标准化和分析监管文件,提高监管决策的效率。例如通 过检测药物不良反应(ADR)并从社交媒体数据中提取相关信息来增强药物警戒。最 后,在上市后监测阶段,语言模型通过对大量文献和报告的分析,更有效地监测药物 的安全性和有效性。

AI 语言模型提高了制药过程的效率。上图展示了 AI 驱动的语言模型在药物发现和开 发中的各个阶段的应用机会,从靶点识别到上市后监测。图中详细描述了每个阶段的 目标、关键任务以及相关的文本文件和数据类型,并总结了 AI 驱动的语言模型在这些 阶段中的具体应用机会和潜在好处。通过改进信息提取、文本分类、文本摘要和情感 分析等能力,AI 驱动的语言模型显著加速和优化了药物发现和开发过程,提高了效 率,降低了成本,并增加了成功率。

AI 驱动的语言模型优化了药物发现和开发过程。上图展示了 AI 驱动的语言模型如何 通过模仿人类智能的某些特点,显著增强了处理和生成文本的能力,特别是在药物发 现和开发的背景下,这些模型可以通过改进信息提取、文本分类、文本摘要和情感分 析等方式,显著加速和优化药物开发过程。 知识转移:AI 驱动的语言模型能够进行迁移学习。这意味着通过预训练模型存储获得 的知识,用户可以通过增量信息或特定领域的知识进行进一步训练。例如,BioBERT 是通过训练原始 BERT 模型与 PubMed 中的生物医学文献而得到的预训练语言表示模 型,它在大多数生物医学文本挖掘任务中表现优于原始 BERT 模型。 知识应用:这些模型可以根据下游任务进行微调。就像人类能够应用正确的知识解决 相关问题一样,预训练语言模型也可以通过增加一个输出层进行微调,从而在各种 NLP 任务中创建最先进的模型。例如,预训练的 BERT 模型仅通过一个微调层就能在 11 个最先进的 NLP 任务中表现优于其他模型。 知识总结:AI 驱动的语言模型能够总结不同文档中嵌入的知识。它们可以生成流畅、 连贯的多句段落,甚至生成整篇维基百科文章。这类似于人类学习的能力,即准确总 结文档中的信息并将其转化为有用的知识。然而,长序列摘要模型需要大量计算资 源,谷歌的 Reformer 模型通过采用局部敏感哈希技术显著提升了处理长序列的能力。

2.AI2.0 制药技术以及应用场景

AI 通过模型训练预测候选 RNA 序列,加快制药速度。RNA 作为药物开发的平台具有 多种细胞功能,例如抑制或表达基因、结合特定靶标以及催化化学反应。RNA 的多功 能性使其成为合成生物学的理想支架。合成生物学是一门应用工程原理来开发新功能 或增强现有功能的学科。通过将生物元件以非天然的方式组合,可以增强分子的特 性。例如,合成引入额外的部分到 mRNA 序列中,以促进自我扩增或环化。此外,进 化原理也被用来探索蛋白质序列库的适应性。然而,转化效率和筛选技术的限制极大 地限制了我们对蛋白质库的探索。AI 通过在序列和其相关功能上训练模型,可以克服 这些限制,从而预测出有前途的候选序列,避免了耗时的库生成过程。

RNA 在药物开发中的多功能性及其在合成生物学中的应用前景。上图展示了 RNA 药物 在临床上的常见应用。RNA 药物的常见功能包括通过 RNA 干扰(RNAi)抑制表达,通 过适配体结合阻断靶标活动,或者通过 mRNA 表达蛋白质。RNAi 通过使用短互补 RNA 序列与目标 RNA 结合,促进通过 RNases 或 RNA 诱导静默复合物的降解。适配体通过 结合靶标来阻断其活动,而 mRNA 则通过翻译过程来表达所需的蛋白质。图中的示意 图分别展示了这些过程的机制,包括 siRNA 介导的静默、RNA 适配体结合和 mRNA 的 表达。

人类可以通过合成生物学对 mRNA 构建体可以进行的显著修饰。图中展示了 mRNA 序 列的不同区域,每个区域都可以通过功能性序列进行修饰,以改善 mRNA 的特性。具 体来说,图中展示了修饰 RNA、自我扩增 RNA 和环状 RNA 的各种修饰及其位置,修 饰核苷酸以提高 mRNA 的稳定性。通过加入亚基因组启动子和复制酶,以促进自我扩 增 RNA 的扩增能力。内部核糖体进入位点(IRES)和内含子的加入,实现 mRNA 的环 化,提高其稳定性。图中展示了不同修饰的具体位置和用途,强调了合成生物学在增 强 mRNA 特性方面的应用。

传统定向进化与机器学习(ML)效率较低,机器引导学习能提高效率。传统定向进 化通常通过使用模板序列生成变异体库,这些变异体通常被转化到细胞中进行筛选, 以找到具有期望特性的变异体。具有期望特性的变异体随后会被进一步使用进行多轮 筛选和优化。这一过程虽然有效,但存在时间长、效率低的问题。相比之下,机器学 习引导的定向进化方法使用在现有数据上训练的模型来预测具有潜力的少量候选变异 体,从而进行进一步筛选。通过这种方法,可以避免大规模生成和筛选变异体的过 程,大大提高了效率和准确性。 AI 通过先进的机器学习技术提高蛋白质工程的效率,减少了试错过程。机器学习模型 可以被训练在成千上万甚至数百万的蛋白质序列及其功能上,从而能够预测出可能具 有所需功能的序列,避免了传统方法中的大量试验筛选工作。 AI 解析这些数据以识别潜在药物靶点并推荐药物构建体,然后将其引入细胞中执行特 定功能。通过分析技术(如微阵列、测序、质谱和定量 PCR)从生物系统中收集各种 组学数据。这些数据包括转录组学(红色)、代谢组学(蓝色)、基因组学(绿 色)、表观基因组学(绿色)和蛋白质组学(黑色)。接下来,AI 评估这些数据集中 的趋势,以识别与特定疾病相关的潜在药物靶点,并推荐适合的药物构建。这一步由 下图中间的计算机系统完成,展示了 AI 在解析大数据集并提供药物开发建议方面的潜 力。然后,这些构建体可以被引入到细胞中,以执行各种功能,包括通过 siRNA 介导 的降解(蓝色虚线圆圈)、通过适配体结合的抑制(红色虚线圆圈)以及表达所需的 蛋白质(黑色虚线圆圈)。这一过程在图的左下角展示,说明了这些构建体如何在细 胞内发挥作用。

AI+合成生物学克服了合成生物学中的一个重大限制,即必须迭代创建、测试和分离 构建体。通过对细胞生物学的深入了解,各种生物分子部件的功能,以及不同类别生 物分子的优点,可以开发出定制和动态的药物。这样,合成生物学可以利用这些药物 将患者体内的细胞编程为仅在需要时激活的药物工厂,用于治疗复杂的疾病。 总结来说,AI 在药物发现阶段的应用显著提高了预测准确性和速度。AI 模型通过分析 大量的科学文献和临床试验数据,能够更准确地预测药物与靶点的结合情况,并在几 个月内交付新的候选药物。报告详细讨论了监督学习和无监督学习在 AI 制药中的重要 性。监督学习依赖标注数据,通过训练模型来预测已知输入与输出之间的关系,广泛 应用于药物发现、设计、毒性预测等任务。而无监督学习通过分析未标注数据,发现 数据中的隐藏模式和结构,应用于基因表达数据分析、化学相似性分析等领域。深度 生成模型(DGMs)在药物发现中也有显著应用,通过学习大量的分子结构数据,生 成具有特定物理、化学和生物活性特性的分子结构,加速早期药物发现。AI 还通过模 拟药物释放、药代动力学(PK)和药效动力学(PD)研究,提高了药物测试的效率和 准确性,减少了动物实验的数量。

相关报告
我来回答