我国生物医药研发大数据集成平台发展及展望分析

我国生物医药研发大数据集成平台发展及展望分析

最佳答案 匿名用户编辑于2023/11/21 11:39

新时期数据资源及其标准化互联互通建 设的战略地位愈发凸显。

一、我国生物医药研发大数据集成平台发展存在的问题

1.生物医药研发大数据集成平台 能力要素建设不足

生物医药研发大数据集成平台基础设施 的建设和可持续运营是一项浩大的工程,构 建稳健的集成平台需要全面的规划、庞大多 元的人才队伍、高精尖技术和资源的稳定投 入,十分具有挑战性。通过向外比较国外 领先国家建设与发展差距、向内审视国内建 设和发展情况,可以发现我国生物医药研发 大数据集成平台在发展过程中,仍面临着计 算设施建设不足的问题。确保足够的计算资 源对于处理生物医药数据至关重要,推动生 物医药研发大数据集成平台的有效利用,需 要大规模的计算资源、存储设备和高速网络 等基础设施支持。尽管我国算力设施的供应 能力正在快速提升,国家东数西算工程能一 定程度改善保障算力的合理供给,但供不应 需、供需失衡的情况在当下而言仍然存在, 将限制数据的收集和处理分析能力。另一方 面更大的问题在于工具资源方面,计算软件 等工具的自主供给缺乏。我们缺乏如 Galaxy 框架那样在生物医药研发生产中有效利用算 力资源的框架指导和相应丰富的工具软件资 源。

2.数据共享、流通、交易的基础 制度体系建设不完善

在我国,生物医药研发大数据集成平台 的发展面临着一个关键挑战,即数据共享、 流通和交易的基础制度体系尚未完善。生物 医药研发大数据集成平台需具有一定的开放 性,以便吸引更多的研究者和合作伙伴参与 其中。保障数据安全和隐私问题为前提适当 加强开放性可以促进合作和创新,当前大多 国内公共平台仍相对封闭。尽管我国在政策 层面鼓励生物医药数据的共享,布局建设了 数据交易中心、生物医药数据集成平台,大 量宝贵的生物医学数据被积累和生成,但数 据的共享和流通仍受到信息孤岛、数据隐私 保护以及知识产权等方面的限制。在法律法 规、隐私和权责等方面的问题是全世界都面 临的困境,主要集中表现在跨越地区、国家 和机构边界共享知识产权、实物样本和其他 资源相关的法律问题存在困难。缺乏明确的 法律法规和规范,以及完善的数据标准和互 操作性,限制了各个机构和企业之间数据的 交流与合作,阻碍了研发平台的有效运作和 创新潜力的充分释放。这种基础设施配套制 度的短板限制了数据的准确性、完整性和实 时性,影响了平台的综合效能和创新潜力的 发挥。

3.生物医药数据平台数字化标准 体系建设与应用程度不够

标准使得整合和合并来自不同来源的数 据成为可能,但生物数据描述和交换的共同 和广泛遵循的标准很少见。生物医药领域相 关数据和知识很多时候并没有标准可循;特 别是对于生物医药某些冷门研究领域信息类 型的数据资源相对有限且有别于常见数据结 构的情况下,数据的互操作性和整合性问题 增加了数据集成平台开发上的难度。研究人 员用各种名称来指代基因、蛋白质和各种生 物实体,缺乏标准化使数据整合更加困难。 大数据平台需要处理来自多个来源的数据, 这些数据可能以不同的格式、质量和标准存 在,对多源数据的清洗、标准化和质量控制 以确保数据的一致性、互操作性和可追溯性 耗费大量时间和精力。我国的生物医药数据 在规范化和标准化方面存在较大的挑战,国 内生物医药数据平台的数字化标准体系建设 与应用程度尚未达到足够的建设水平,面向 医疗卫生和生物医药领域的信息化厂商的标 准化规范指导和应用缺乏,当下不同医疗机构和系统使用的数据格式存在较大差异。标 准体系不足的情况影响了数据的准确性、可 靠性和可比性,从而制约了生物医药研发的 深入合作和创新。

4.可持续运营发展是当前大部分 国内平台所面临的重要挑战

在平台资源整合过程中,通常通过跨区 域集中数据库,基于互操作标准将数据库连 接起来,节省了成本和提高了效率。但这种 模式却进一步加剧了平台发展的可持续性问 题。一旦其中某一数据库“死亡”,可能在 相互关联的环境中留下空白,并影响其整体 功能。此外,平台的可持续往往掣肘于资金 支持。在面向平台建构方的调研当中,本白 皮书团队也得到了同样的答案。仅考虑数据 库,一项针对 326 个数据库的 18 年生存率 的研究发现,超过 60% 的数据库在这段时 间内死亡,另外 14% 在存储后不再更新。 很少有国家或国际资助组织有专门的、定制 的资助计划来支持研究基础设施的长期可持 续性,包括数据库等数据资源。特别是,与“令 人兴奋的新研究项目”相比,生物信息学数 据库的维护在资金支持方面难度更大 [25]。我 国生物医药研发大数据集成平台在发展过程 中面临着可持续运营发展的重要挑战。大部 分国内平台需要应对数据存储和管理的高成 本,以及保持技术和设备的更新换代所需的 巨额投资。此外,确保平台的长期可用性、 数据质量和安全性也是重要挑战,需要不断 改进和加强。解决这些挑战将需要政府、产 业界和学术界的共同努力,以确保生物医药 研发大数据集成平台的可持续成功发展。

二、我国生物医药研发大数据集成平台发展展望

随着科技的不断进步,开放与协作会带 来新的增益,通过采用隐私计算等新的技术 手段保障数据安全、所有权实现对多数据主 体的数据的利用,通过商业化模式团结连接、 深化和规模化资源一站式供给,基于创新基 础设施系统性开展以应用为导向的数据协作 是一种潜在的有效方案。

新时期数据资源及其标准化互联互通建 设的战略地位愈发凸显。数据资源仍然在加 速增长中,大规模的数据带来的数据处理与 开发难度也在快速增长,沉淀的数据是否都 有价值或一直有价值?我们有必要考虑建立 数据的价值评价体系以系统指导数据资源的 科学管理。当我们困于怀抱“数据金矿”的 展望中时,还需要去认识数据价值可能的衰 减问题以及数据开发及时性对价值的影响。 数据间存在的潜在替代性和迭代性,通过更 好的技术、规范和标准的应用,我们可以生 产出更符合使用需求、更具竞争力的数据内 容。这提示我们将标准作为数据集成平台建 设中的前置条件或者基础条件,是一项必要 的且具有深远影响的工作。当然,我们确信 标准的价值已经得到广泛的认同,但对标准 的使用能力,在国内外的平台之间仍然存在较大的差距。开发更实用的标准、更易用的 标准是一项需要我们为之努力的重要基础性 工作。在工具资源建设方面,我们需要投入 更多的关注度,整合可以在界面实现快速的 丰富性的功能提供,但扎实做深做实工具在 解决目标问题上的能力才是每个工具被广泛 应用的核心评判。AI 技术的快速发展,大模 型的爆发增长,为数据价值挖掘工具开发提 供了新的方法。同时,国内外发展经验还给 了我们的一点启示:稳定的组织化的运营维 护和更新,是保持平台生命力与铸就广泛影 响力的必要基础,我们应该更有耐心和决心 去深耕一项具有价值的事情。

我们可以预见生物医药研发大数据集成 平台将成为医学研究和药物开发的重要驱动 力。我国迫切需要建设和发展综合性的生物 医药研发大数据集成平台,逐项破解生物医 药研发大数据集成平台发展面临的问题需要 行业的共同智慧与努力。在此,我们呼吁各 界积极关注共同探索,为疾病的早期诊断、 个性化治疗和新药开发提供坚实支持,以提 高生物医药领域的研发效率,改善患者生活 质量,推动医学科学的进步。

参考报告

imit白皮书:全球生物医药研发大数据集成平台观察.pdf

imit白皮书:全球生物医药研发大数据集成平台观察。介绍生物医药研发大数据集成平台内涵,从生物医药领域、信息化、研发范式和规模化等多维视角深入认识生物医药研发大数据集成平台。梳理生物医药研发大数据集成平台在重大科技基础设施趋势化发展下呈现的演进规律和态势。阐明生物医药研发大数据集成平台集成化建设和集群化发展的作用与价值。

查看详情
相关报告
我来回答