阿里研究院-全球数字经济财税金融动态.pdf
- 上传者:风****
- 时间:2024/05/15
- 热度:285
- 0人点赞
- 举报
阿里研究院-全球数字经济财税金融动态。世界银行:人工智能(AI)对数据开发利用的变革作用。
(1)AI 通过元数据增强(Metadata Augmentation)改变数据的记录方式。元数据(Metadata)是描述数据属性的数据,用来支持指示存储位置、历史数据、资源查找、文件记录等功能。元数据能确保研究人员找到最佳现有数据并从中获取知识。但元数据的可用性和质量是决定数据是否易于理解、可发现和可再利用的一个重要制约因素。记录数据和整理元数据的过程往往是一个手动、繁琐且耗时的过程,这导致许多数据集缺乏详细元数据来确保可访问性和再利用性,一直处于隐藏和未充分利用的状态。AI 提供的元数据增强这一变革性解决办法有可能使元数据的生成和增强实现自动化。生成式 AI 可从调查报告和数据字典中自动生成摘要、介绍和主题思想,自动提取和生成关键词从而改进搜索结果。这有利于数据生产者、管理者和用户获得更丰富的元数据,从而提高数据的利用率和再利用率。
(2)AI 提供最相关的数据用于数据发现(Data Discovery)。传统的数据发现系统通常依赖于词法搜索或关键字搜索,但是查找内容仅限于元数据中的确切关键字。同时,不熟悉专门术语的用户在使用这种基于关键字搜索的系统时,可能因不知道要搜索的确切术语而错过相关数据。因此,数据发现系统不仅应该对元数据进行索引,还应该理解术语之间的上下文关系,确保搜索结果全面且相关。诸如混合搜索、语义搜索、知识图谱和推荐系统等AI 技术的实施可以显著增强数据发现系统,进而让用户能够花费尽可能少的时间找到他们需要的数据。
(3)AI 通过大语言模型优化数据使用情况评估。鉴于研究人员在界定或表述他们在文献中使用的数据方式上具有很大区别,因此衡量数据如何或是否被使用仍然是一个挑战。大语言模型可从非结构化文本中提取结构化信息,创建一个“数据使用数据库”,从而分析数据对信息传递和知识生成的影响,优化数据使用的评估方式。
(4)利用 AI 生成合成数据(SyntheticData)突破数据传播的限制。隐私和安全问题限制了数据的有效传播。合成数据是通过算法、统计模型或 AI 生成的数据,而非真实的观测数据,例如,以敏感数据集为基础生成的不包含敏感信息但包含其他信息的数据。联合国欧洲经济委员会发布的《官方统计合成数据指南》表明,使用更先进的AI 生成合成数据提供了创建真实数据的方法,合成数据既可为用户提供分析见解,也可最大限度地减少披露风险。
免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。
- 全部热门
- 本年热门
- 本季热门
- 数字经济专题报告:建筑提智增效,数字大有可为.pdf 16795 6积分
- 从数字经济视角解读:新质生产力研究报告(2024年).pdf 13152 7积分
- 中国数字经济发展白皮书(2021年).pdf 9588 37积分
- 产业互联网深度报告:从消费互联网到产业互联网的核心洞察.pdf 7353 8积分
- 数字化前瞻研究:数字新基建,数字生态,数字经济.pdf 6505 8积分
- 2022中国数字经济发展研究报告.pdf 5217 6积分
- 2022中国数字经济政策及发展研究报告.pdf 4794 9积分
- 谷歌&淡马锡2019东南亚数字经济报告.pdf 4723 8积分
- 数字经济117页深度报告:产业数字化未来已来.pdf 4377 12积分
- 麦肯锡 数字时代的中国-打造具有全球竞争力的新经济.pdf 4153 15积分
- 广西县域数字经济发展评估报告(2025年)-广西壮族自治区信息中心.pdf 1429 5积分
- 新京报:2025年数字经济下灵活就业发展研究报告.pdf 1044 35积分
- 2025海外消费者数字经济报告.pdf 511 39积分
- 新疆数字经济研究院:新疆平台经济发展调研报告(2025).pdf 424 5积分
- 2025海外数字经济信任度报告.pdf 393 39积分
- 信息化与软件产业研究2025年第1期(总89期):数字经济时代数字创新生态的典型特征、建设实践及对策建议.pdf 381 5积分
- 云基华海:2025国际可信数据空间发展现状与趋势研究报告.pdf 353 17积分
- 数字经济系列“十五五”前瞻:“十五五”时期数字经济六大重点与五大趋势.pdf 351 6积分
- 中国信通院:数字原生典型案例集2024-2025.pdf 348 7积分
- 【技术报告】区块链基础设施研究报告(2024年).pdf 307 6积分
- “十五五”区域数字经济发展研究报告.pdf 227 6积分
- 2025年世界投资报告数字经济领域的国际投资概述.pdf 202 8积分
- 2025年我国数字经济发展形势展望.pdf 193 4积分
- 《2025东南亚数字经济报告》英文版.pdf 188 22积分
- 数字经济中的国际投资:政策制定者的工具包(英译中).pdf 163 6积分
- 2025数字经济与人工智能领域全球未来法律发展展望报告.pdf 153 4积分
- 纵横股份深度研究报告:全谱系工业无人机领军企业,以“低空+AI行业应用”深化布局低空数字经济——华创交运低空60系列(二十七).pdf 139 4积分
- 公募基金周报:中证A500ETF流入规模超300亿元,中证东盟数字经济主题指数发布.pdf 117 3积分
- 实体经济和数字经济深度融合发展报告(2025)-“人工智能+”创新应用.pdf 109 6积分
- 山东省数字经济创新平台:2026城市地面服务机器人空间治理白皮书(第一版).pdf 65 3积分
