从 AI4S 现阶段 的应用情况看,先期的优势主要集中于几大方向:
1、AI4S 应用以高效为核心驱动,率先对症三大痛点
AI4S 目前已广泛应用于药物研发、生物技术、材料科学、能源与环保等领域。总结他们 的共性可以为化工行业的 AI 赋能提供有效参考。典型案例是 AlphaFold 模型预测蛋白质 三维结构:在过去几十年里,确定蛋白质的三维结构是一个耗时且昂贵的过程,常用实验 技术如核磁共振和冷冻电子显微镜虽然有效,但成本高昂并且解析速度慢,全世界仍然有 数以亿计的蛋白质尚未被解析,而 AlphaFold2 较为完美的解决了上述问题,在 2020 年的 14 届蛋白质结构预测挑战赛(CASP14)中 AlphaFold2 以绝对优势 81.07 分打败其他实验 室团队(第二名 31 分)。此外,还有 NLP 模型(GPT-4 等)解析海量生物医学文献提出 新假设、GNoME 模型预测无机晶体结构等。尽管应用场景各异,但其底层技术和方法论展 现出高度的共性。

AlphaFold2 工作原理分为四步:①训练用数据库:使用来自 UniRef90、BFD、Uniclust30 和 MGnify 的多序列比对数据,总计约 220 亿条蛋白质序列。②序列分析:分析所有相 似的氨基酸序列和可能相互作用的氨基酸,生成氨基酸在结构中的关系图。③AI 分析:使 用神经网络识别需要特别关注的重要元素。④生成结果:将所有的氨基酸组合并生成一个 假设的蛋白质结构并将假设的结构重复进行上述步骤通过多次循环后得到一个特定的结 构。 以 AlphaFold2 为例,我们总结出 AI4S 应用场景的 3 类特点。 1.长研发周期与高成本:这些领域的研发通常耗时长、耗资高,而 AI 能显著缩短周期。 例如深度学习能将蛋白质结构解析从年度缩短到分钟。 2.数据驱动与大规模计算:AI4S 应用的首要特征是其对海量数据的依赖和处理能力。科 学研究本身就是一个产生和利用数据的过程,无论是实验测量、模拟计算还是文献记录。 AI 模型,尤其是深度学习模型,擅长从多模态的复杂数据中(如图像、光谱、文本、序列 数据)提取深层模式和关联性。 3.高维度设计空间:这类问题通常具有大量组合可能,传统实验无法逐个验证。AI(尤其 是生成式模型和图神经网络)擅长在高维优化空间中搜索最优解。比如在材料设计中,AI 根据成分预测性能并“先验筛选”大量候选。
2、创新是现阶段 AI 在化工应用的主旋律,关注六个细分方向
(一)生物发酵行业菌株筛选和流程优化
在发酵行业中,菌种是生产反应的核心,生产原料、生产成本、生产效率、环保危废等系 列企业竞争中的核心因素都和菌种高度密切相关。无论是在传统生产中,进行菌种优化, 提高效率,降低成本;还是在创新领域,研发生物工艺路径,解决物理、化学工艺难以突 破的工艺难点,菌种都是核心关键问题。虽然合成生物获得了较快的发展,但是仍然以归 纳以往数据,预判多种可能,不断测试排除为重要路径,即使能够借助高通量工具实现效 率的大幅提升,成本的下降,但仍然有大量的环节存在优化效率或者人工智能模拟的空间, 比如菌种鉴定、培养基设置等。 传统菌种鉴定方法存在耗时长、准确性不足等问题。在过程控制方面,微生物数量动态调 控和风味物质检测仍依赖经验或复杂仪器如色谱联用技术,难以满足工业化生产对实时性 和精准性的需求。而机器学习模型如神经网络、随机森林可显著提升菌种鉴定准确率,并 通过多参数监测实现发酵过程的动态优化。 微生物发酵法具有来源丰富、条件温和、产品活性高等特点,许多化合物依靠其生产,但 传统发酵过程是一种非线性、非结构化的复杂系统,涉及多种影响因素,难以获得令人满 意的优化条件。目前,研究学者已经尝试将人工神经网络与遗传算法用于发酵培养基的优 化中,比如周勇等用人工神经网络与遗传算法优化脂溶性醌类化合物发酵培养基,使其化 合物产量提升了 63.33%。

(二)新型材料的应用和适配
目前新型材料研究热点集中在“高性能/多功能材料”与“绿色可持续材料”两大类,存 在三个共同挑战: ①搜索空间极其庞大,一个新聚合物或复合物可以有数以万计的单体/组分和制备工艺组 合,传统人工作业无法逐一试验; ②多目标优化难度高,新材料需同时满足强度、韧性、导电性、热稳定性等多重性能,且 往往存在相互矛盾,需要在结构-性能-工艺的高维空间权衡取舍; ③合成路线复杂,很多创新材料(如特殊纳米结构或金属有机框架)合成路径尚不清晰, 传统经验式优化既耗时又难以兼顾经济与环保要求。 而借助 AI 学习算法,构建材料性能预测模型,通过对海量材料数据(包括成分、结构、 制备工艺等)的学习,模型能够快速预测新材料的性能,如强度、导电性、耐腐蚀性等。 如,利用深度学习算法对材料晶体结构数据进行分析,预测材料在不同条件下的力学性能。 同时,结合遗传算法等优化技术,对材料成分和制备工艺进行智能优化。在新材料研发过 程中,通过模拟不同成分和工艺组合,快速筛选出最具潜力的方案,极大的缩短研发周期: ①大规模虚拟筛选与预测:机器学习模型可通过已有的材料数据库预测新化合物的性质, 将实验筛选转化为计算筛选。先进神经网络和图神经网络能够学习高维结构与性能的映射 关系,在短时间内评估数十万种候选物的物理化学性能,从而优先确定最有潜力的配方; ②生成式逆向设计:AI 可根据目标功能“反向设计”材料结构。生成模型被用来创建满 足设定性能指标的新分子或纳米结构。 比如在航空领域,研究高强度、轻量化材料;半导体领域,筛选适合的元素组合和生长条 件;新能源领域,筛选潜在的电池材料和组合等。
(三)农药创新药等药剂产品的开发
农药与医药的研发存在高度相似的逻辑框架,两者均涵盖仿制药与创新药(创制药)的开 发路径,核心流程涉及活性分子筛选、靶点识别、结构优化及安全性评价等关键技术环节。 虽然应用领域不同,但其底层研发逻辑和技术体系基本一致。基于此,农药行业可借鉴医 药行业从仿制向创新转型的成功经验,特别是在 AI 辅助分子设计和高通量筛选等领域, 通过引入先进理念和成熟机制,进一步提升农药研发的创新能力和效率。 具体来讲,医药与农药在作用靶点层面存在高度同源性,这是因为二者均干预生物体的基 本生命活动,如神经传导、细胞分裂与代谢调控等,从而许多分子靶点在结构和功能上具 有一致性。例如,鱼尼丁受体(RyR)是调控细胞钙离子通道的关键蛋白,医药领域通过 兰尼碱类药物作用于心肌细胞的 RyR 治疗心律失常,氟虫酰胺等农药则通过激活昆虫 RyR 诱导钙流失致死;乙酰胆碱受体(nAChR)是神经信号传导的重要靶点,加兰他敏通过调 节 nAChR 治疗阿尔茨海默病,吡虫啉等新烟碱类农药则靶向昆虫 nAChR 致其麻痹。靶标的 相似性推动了两行业研发策略的相似性。
(四)辅材催化剂、添加剂等的升级优化及后续产物分离
催化剂在化工行业中具有不可替代的重要作用,是现代化工生产的核心技术之一,在连续 运行的反应器中,催化剂是整个过程的“心脏”,其性能直接决定了反应的效率、选择性 和经济性。然而,催化剂在严苛的连续反应条件下会不可避免地发生失活,这是制约装置 长周期稳定运行的首要难题。首先,化学中毒是主要原因之一,例如,烟气脱硝(SCR) 催化剂中的碱金属会破坏其酸性位点,造成不可逆失活。其次,积炭或焦化是高温烃类反 应中普遍存在的失活途径,沉积的碳会覆盖活性位点,堵塞孔道。其他失活机制还包括水 热老化、高温导致的活性组分烧结、流体冲刷造成的机械磨损、活性物种的浸出和脱落等。 因此,研发人员需要综合考虑多维度数据才能有效解决失活难题,该特点符合 AI4S 应用 特点。 反应后的产物往往是包含目标产物、副产物、未反应原料和催化剂的复杂多组分混合物。 将其高效、低成本地分离提纯,是决定整个工艺链经济性的关键环节,其能耗通常占石化 工业总能耗的相当大部分,为了克服传统技术的弊端,以膜分离、吸附分离、先进结晶等 为代表的新兴分离技术应运而生。吸附剂/晶种的开发与规模化生产成本高昂,吸附/解吸 或结晶/溶解循环的能耗与效率,以及设备复杂、操作周期长等问题,限制了其在超大规 模石化生产中的广泛应用。而 AI 通过分析海量化学结构与性能数据,可预测新型吸附材 料效果和成本,将传统“试错法”研发周期从数年缩短至数月。

(五)材料的微观结构等升级、改造
由于材料组分和结构的巨大潜在组合,研究人员系统地探索材料空间面临成本的巨大挑战。 在目标材料数据有限的情况下,从其他材料的大型已知数据集中进行跨晶体结构的高效迁 移机器学习,成为智能材料设计中的重要实用策略。 来自上海大学材料基因组工程研究院的刘轶教授和冯凌燕教授团队,提出了一种基于大规 模尖晶石氧化物计算数据集的深度迁移学习方法,用于预测热力学稳定的钙钛矿氧化物。 他们用 5329 个尖晶石氧化物结构的形成能开发了基于结构信息“中心-环境”(CE)特征 的深度神经网络(DNN)源域模型,然后通过学习 855 个钙钛矿氧化物结构的小数据集对 模型参数进行微调,获得了在钙钛矿氧化物目标域中具有良好可迁移性的迁移学习模型。
(六)配方设计、升级和应用
电解液在锂金属电池中起着至关重要的作用,不仅促进锂离子的传导,还在正/负极界面 处分解形成成分和结构各异的固体电解质界面(SEI),这些界面最终影响电池的电压范围 和循环稳定性。然而,电解液配方与电池性能之间的相关性尚未明确,这给开发更高效的 电解液带来了挑战。传统的电解液开发通常是基于试错法,涉及电解液的制备、对电池进 行大量的电化学测试以表征其性能、重复这些步骤以优化配方,最终获得最优的电解液配 方。然而,这种方法成本高昂且效率低下,难以精确控制电解液成分,面临诸多挑战。利 用 AI,通过统计分析大量的数据(包括盐、溶剂、添加剂及其配方),可以指导新溶剂分 子、新添加剂、新配方和新溶剂化结构的预测,最终实现最优的电解液设计。
3、优化生产和资源调配也是 AI 将逐步兑现的领域,关注设备升级带来的长期变化
和其他制造业差异相对较大,化工作为材料生产环节,生产涉及的参数相对较多,生产的 安全性要求也明显较高,很多生产环节设计到高温、高压、有毒、易爆等危险环境,无论 是在材料储备、生产制造、质量检测、检查维修等多个环节都更倾向于对高度智能化替代。 相比于海外企业,国内化工企业的起步时间确实相对较晚,但由于早期的基础相对薄弱, 很多细分赛道的生产装置的建设周期横跨了多个阶段(技术引进、本土化改造、工艺升级、 规模化放大等),装置的新老程度明显不一,虽然部分大规模的产品经历了 2016 年的供给 改革,但老旧装置仍有存留,小规模赛道产品的淘汰相对较低。目前看很多 10 年以上的 装置的自动化程度仍然相对较低,虽然部分企业经过自身的技术改造,但仍然有进一步优 化升级的空间,有望带动相关的自动化工程设备的需求提升。
(一)重复环节人工替代或者关键、危险环节检测
大部分化工品类成熟度极高、改进难度大,当前更多的问题主要在于产能过剩和环境指标。 国家发改委指出,我国纯碱生产技术已达国际先进水平,多数企业单位能耗已优于先进指 标,节能降耗空间非常有限,且在更严环保要求下“领先企业的能耗可能会出现不降反增” 的窘境。因此,AI4S 赋能较为有限,未来应用的方向更加偏向于全流程监控和精细化调 控。比如,杭州电化集团研发的“AI+机器人”巡检系统在氯碱装置 50–60℃高温、有毒环 境下工作,“机器人狗”能精准检测约 5000 根 PTFE 管线是否断流,检测算法正确率达 99.99%,远超人工巡检效率;中控技术为湖北三宁化工的硫酸装置部署了 AI 系统,通过 大模型实时监测生产数据,实现关键指标的超前预警和自动调节建议。
(二)、生产过程的智能优化
由于多数大宗化工产品的生产同质化相对较高,产品难以形成销售溢价,因而各个生产环 节对于成本的影响都极为重要,是企业利润兑现的关键。从原材料配比消耗、生产过程的 能源利用、生产的连续和稳定性、生产装置的安全性、产品的转化率和副产物的利用、下 游产品的设计和匹配等,都对生产成本产生极大影响。 虽然在部分头部企业生产过程中,已经实现了一定的自动化控制和远程监控,但借助于 AI 的模型优化不仅可以实现实时监管,还能有智能化的参数调整,未来运行的提前预判等。 通过传感器实时采集材料生产过程中的数据,如温度、压力、流速等形成个体运行的数据 基础,通过数据分析和机器学习算法,构建生产过程模型,实现对生产过程的实时监测和 智能控制。如,基于神经网络算法的控制系统,根据实时生产数据调整设备参数,确保生 产过程稳定,产品质量一致。同时,运用预测性维护技术,通过对设备运行数据的分析, 提前预测设备故障,安排维护计划,避免生产中断。 同时在质量控制方面,通过实时监测和精准控制,AI 系统能够对生产过程中的每一个环 节进行精细化控制,确保产品质量的一致性,生产的连续稳定,能够避免因为频繁调整修 正带来的物料和能源损耗。
(三)、给予充分、实时市场信息进行的资源调配
虽然对于多数大宗产品具有同质化的属性,但仍然有相当多的领域具有特殊的行业运行模 式,比如原材料的渠道布局,产品的市场拓展和销售等。比如生物质能源的原材料和产成 本的市场对接。不同于化石能源,生物质能源具有区域、气候等区域差异,在进行原材料 储备过程中需要充分了解供给、空间、库存、竞争对手等多维度信息,在产成品销售过程 中,也需要有季节性、区域等产品定价差异,产品库存等压价差异,产品运输等排期差异。 在盈利空间并不算非常丰富的产品领域,能够充分结合多维度信息形成资源调配也将明显 赋能企业短期生产经营决策,以及未来长期规划避免过度竞争的发展规划。