从发展阶段来看,深度学习技术的快速突破正在驱动人工智能以 前所未有的速度逼近通用智能。
自 2014 年起,随着以生成式对抗网 络(Generative Adversarial Network,简称 GAN)为代表的深度学习 算法的提出和迭代更新,人工智能处理单一任务水平大幅提升,专用 式人工智能技术逐渐成熟。而 2022 年底美国开放人工智能研究中心 (OpenAI)发布的 ChatGPT 则代表了通用式人工智能的技术进化, 聚焦于人机交互的封闭环境,人工智能已经能够同时实现多项复杂的 任务能力。深度学习在未来仍将持续“大模型+大算力+大数据”的主 导路线,逐渐逼近人机交互环境下的有限度通用智能,这也对算力、 研发等工程化能力提出更高要求。同时,海量专用小模型正在更深入 与行业核心业务能力相结合。在“大模型主导,行业小模型应用落地” 两类路线叠加驱动下,人工智能将持续规模化应用,并不断逼近与人、 环境交互协同的通用智能。
从产业布局看,领军企业持续迭代基础通用大模型,主导力量正在逐步形成。一是,领军企业持续迭代基础通用大模型,完善各类模 型能力布局,探索产业服务模式。以 OpenAI 的 GPT-4,谷歌(Google) 的 bard,百度文心一言大模型,科大讯飞星火大模型等为代表,大语 言模型正在逐步将其能力范围扩大至金融、医疗、能源等领域,探索 大模型落地的专业化场景。二是,开源模型技术体系打破闭源模型垄 断壁垒。以元宇宙公司(Meta) Llama2 模型,稳定人工智能公司 (Stability AI)的稳定扩散模型(stable diffusion),斯坦福大学羊驼 (Alpaca)模型等为代表,开源模型已成为部分企业及高校研究机构 的发力点,逐步赋能更多开发者和学习者,加速产业整体发展和进步。 三是,贴合业务场景的专业大模型纷纷入局。例如上海人工智能实验 室开发的全球首个城市级实景三维大模型书生·天际,网易游戏伏羲 大模型等,创新主体及行业企业紧跟大模型热潮,与自身业务场景结 合,提升对外服务能力。
从商业化落地来看,人工智能行业主流产品形态是生成式人工智 能(AI Generated Content,简称 AIGC)。目前,大模型在日常办公、 文本创作、图像视频生成、游戏等领域拥有较大发展潜力,商业化前 景相对清晰。在文本生成端,AIGC 已经可以利用自然语言生成技术 自动生成文章、小说、新闻摘要、诗歌等文本内容;在图片生成端, 图片风格转换、图像修复和补充、生成艺术作品等产品正逐渐落地; 在音视频生成端,合成音乐、生成环境音效、视频合成和特效生成等, AIGC 可以提升制作效率。未来,AIGC 能够针对科学发现类的任务, 逐步渗透生产力变革。大模型有望作为基础赋能工具,发现更多领域通解,在更多领域实现价值创造和产业升级,如解决数学问题,发现 新材料配方,配合药物研发预测药物理化性质等。
知识产权问题是企业对于使用生成式人工智能的首要担忧。在德 国人工智能内容治理公司 Acrolinx 于 2023 年 8 月对 86 家财富 500 强 公司的调查中1,近三分之一的受访者表示,知识产权是使用生成式 AI 的最大担忧。而由代码管理公司 Gitlab 对超过 1000 名从业者开展 的调查发现2,95%的高级技术主管认为知识产权和隐私保护是使用 AIGC 的首要考虑对象,也有 79%的受访者担心人工智能工具会获取 知识产权或私人数据。
究其根本,还是现有的人工智能技术在著作权、专利权、商标权、 反不正当竞争等方面都面临法律挑战。在著作权方面,人工智能应用 程序生成文学和艺术作品的能力日益增强,可利用大模型模拟人类思 维活动、从事智力成果的生成与传播活动,这对著作权制度一直与人 类的创造精神以及对人类创造力表达的尊重、奖励和鼓励立场产生挑 战。如算法和模型的训练阶段,人工智能训练数据可能存在输入端的 侵权责任问题;而在内容生成阶段,输出端的生成物是否属于著作权 法保护范围也备受争议。在专利权方面,一是人工智能应用或算法是 否应被视为可专利的计算机程序或软件,以及其可专利客体的审查规 则究竟如何细化一直备受关注;二是人工智能本身是否具备法律主体或专利权人资格。在商标权方面,随着越来越多地使用人工智能进行 营销,以及消费者受算法推荐影响,需要重新考虑人工智能推荐算法 是否会淡化品牌的商标价值。在反不正当竞争方面,人工智能生成内 容模糊了原创性辨识,难以判定内容的真实性,使得自动化生成的内 容可以通过虚假宣传或误导消费者,可能会涉嫌不正当竞争行为。
从产业关心热点来看,核心问题聚焦在著作权上。一方面,需要 著作权法界定输入端的合理使用范围和侵权责任承担。在人工智能数 据的输入端,大语言模型需要使用大量语料数据。而开发者和企业在 未经允许的情况下,通过算法设计和程序运行的自动化,利用他人著 作权作品片段组合成创作物表达,“洗稿”“拼凑”其他作品,可能 会构成对他人作品的侵权。此时,需要利用著作权法上的合理使用原 则来对相关侵权行为进行合法豁免,也需要著作权法主动厘清现有大 模型训练中的侵权责任认定规则。另一方面,需要著作权法明确输出 端人工智能创作物的保护范围。人工智能的创作活动可能涉及人类作 者和人工智能系统之间的合作或分工。尽管人工智能系统可以协助创 作者,但通常需要人类创作者来设置参数、提供指导、进行编辑和选 择最终的创意成果。著作权可以保护知识和智力劳动的成果,确保创 作者得到应有的认可和回报,因而是明确作品权利归属和保护的合理 选择。对于产业链上下游的不同参与主体,著作权法参与了重要的利 益分配环节。