AIGC生产力工具赋能办公场景,带动工作效率有效提升。
1.2024年全球AIGC产业全景图谱
天津市人工智能学会、至顶科技、至顶智库联合发布2024年全球AIGC产业全景图谱。 图谱主要分为基础设施层(AI服务器、AI计算集群、AI芯片、MaaS平台、AI数据服务);模型层 (通用大模型、行业大模型);场景应用层(智能助手、金融、医疗、办公、教育、奥运、智能汽车、 营销、影视、法律、政务)。图谱中涉及各领域全球代表性企业和相关机构,为读者提供更为详实的 参考信息。 相比去年,基础设施层新增MaaS平台和AI数据服务;模型层新增通用大模型和行业大模型的类别划 分;场景应用层按细分场景进行划分。
2.全球科技巨头在AIGC领域的投资情况
OpenAI等全球知名AI独角兽成长过程中,离不开投资者源源不断的资金支持。生成式AI发展过程中,需要大量投入算力和财力,大模型训练完成 后投资回报周期较长,使得初创企业难以独自承担相关成本,全球最有竞争力的企业才能获得资本市场的认可拿到融资。国外投资企业主要包括 微软、亚马逊、谷歌等互联网巨头,也有像英伟达在AI浪潮中成长起来的新巨擘。国内投资企业主要有阿里巴巴、腾讯、小米等平台型企业。相 关融资企业以基础模型公司为主,如OpenAI、Anthropic、智谱、百川智能、零一万物等。
3.场景应用篇
AI搜索成为信息检索领域的关键驱动力,通过大语言模型和检索增强生成技术,提升搜索结果的准确性。核心能力体现在提升简单问题的解决效 率、提升复杂性问题的处理能力以及多模态AI搜索能力方面。从全球AI搜索市场格局来看,主要以美国的OpenAI ChatGPT search、Perplexity和 中国的阿里巴巴夸克为典型代表。伴随大模型的不断发展, AI搜索将为用户提供更加可靠且具有个性化的搜索使用体验。

AIGC生产力工具赋能办公场景,带动工作效率有效提升。微软发布的Microsoft 365 Copilot和金山办公发布的WPS AI,为日常办公中文字处理、 文案生成、PPT布局、排版美化、框架搭建、数据分析、图表可视化等任务提供丰富应用,使得用户仅通过文字描述的方式实现相应功能,减少以 往复杂交互过程,提高工作效率同时有效降低工作时长。
AIGC应用于工业制造的研发设计、生产制造和供应链管理等环节。研发设计:AI大模型+EDA/CAE/CAD将对芯片设计等方面有效赋能;生产制造: 以ChatGPT为代表的AI模型进一步加强工业机器人的交互与任务执行能力;供应链管理:有效实现智能化运营管理,简化供应链订单管理流程, 推动数字孪生系统构建,实现工厂管理的实时可视化。
AIGC赋能金融多场景,提升金融服务的效率与质量。当前多家科技公司与金融机构紧密合作,将AIGC能力应用在投研、投顾、风控、客服等场景。 智能投研:通过文本生成等技术帮助分析师快速提取关键信息;智能投顾:利用大模型有效提升投资决策能力;智能风控:智能化模型提升风险 识别能力;智能客服:提供线上线下的智能服务体验。此外,大模型在远程银行系统中也实现全面覆盖,提供多项智能化技术赋能。
AIGC促进虚实融合,营造线上沉浸式购物体验。AIGC通过与AR、VR等技术结合,在电商营销场景中实现虚拟主播带货、三维商品构建、服饰在 线试穿等功能。虚拟主播带货:实现自由更换妆发、服饰和场景,给用户提供全新观感;三维商品构建:提供虚拟产品多方位视觉感知的独特体 验,大幅压缩沟通时间成本;服饰在线试穿:消费者在虚拟模特上试穿不同衣物,提升用户购物体验,减少退换货情况。
AIGC模型与医疗多场景有机结合,协助医生为患者提供更好的护理体验。Google推出包含Med-Gemini-2D,Med-Gemini-3D以及Med-GeminiPolygenic的Med-Gemini系列模型,实现在放射学、病理学、皮肤学、眼科学和基因组学的医疗应用。医联MedGPT可以整合多种医学检验检测模态 能力,实现线上问诊到医学检查的无缝衔接,通过多模态应用,实现从问诊到康复指导的全流程诊疗。

AIGC在合同起草、研究分析、诉讼支持等法律领域广泛应用。AIGC可用于自动化合同起草、法律文件摘要、法律案例分析等任务,从而提高效率、 减少人为错误,并为律师和法律专业人士提供更多的资源和支持。此外,AIGC可以自动分析大量法律文献,并提取关键信息的优势可被用于法律研 究,从而帮助律师和法律专家更快地了解案件和相关法律。目前国外的CS Disco和中国的法大慧云等初创企业已推出法律相关的AI智能化解决方案。
AIGC辅助学生学习提升,帮助教师轻松备课。对于学生而言,AIGC可为学生提供自适应学习、口语陪练、智能排课、在线答疑等学习支持。对于教 师而言,可优化教学设计三大环节,创新规划单元教学设计、一键生成互动教学课件、智能教学评价,明显提升教师课前备课、课中观察、课后评 价效率和质量。
AIGC催生全新游戏玩法,增强游戏畅快体验。AIGC贯穿从游戏开发、游戏发行到用户体验全过程。游戏开发阶段:从文本、图像、音频、视频、 三维、策略六个维度出发,实现多模态内容输出;游戏发行阶段:在推广准备阶段分析行业趋势,到推广初期快速生成素材,再到推广后期推广 活动,游戏宣发成本迅速降低。用户体验阶段:玩家在游戏上可与智能虚拟角色进行交流,体验个性化声音特效和角色道具。
4.前沿趋势篇
2024年9月,OpenAI发布推理模型o1,该模型的训练过程使用强化学习技术,通过显式嵌入原生「思维链」(NCoT)过程,能够出色地完成复杂 的推理任务,将复杂的步骤分解成更简单的步骤,以便更容易理解和处理,该模型在科学、编程和数学领域都取得卓越表现
真实数据供不应求,合成数据将填补AI模型训练数据供需鸿沟。AIGC模型训练过程需要大量数据,然而高质量真实数据即将耗尽,合成数据技术 将成为数据供给侧的主流解决方案。Gartner预测,2024年合成数据将占到所有训练数据的60%,到2030年合成数据将占据主导地位。合成数据可以 由计算方法和模拟来创建,包括文本、数字、表格、图像、视频等形式,具有低边际成本、隐私保护、减少偏见等优点。

智能体 (AI Agent)基于大模型能力,由记忆、规划、工具、执行四部分构成,能依据用户输入的自然语言,自主决策解决问题。AI Agent将复杂 任务分解为小任务并确定先后顺序,可调用计算器、API等工具帮助任务完成,还能存储和管理外部知识为决策和执行提供支持。下面是AI Agent 对业绩点评任务进行规划、拆解、执行的过程演示。
检索增强生成(RAG)是通过检索信息并加入大语言模型生成过程的技术,其能提高模型生成内容的准确性。大语言模型因为预训练数据中存在 过时和不正确信息以及微调过程中引入新信息,可能出现“幻觉”。RAG的基本步骤包括:1.对外部知识文档进行解析、分块、嵌入等预处理形 成索引;2.检索器根据用户问题对外部知识进行检索,将相关性高的文档交给生成器;3.生成器根据用户指令及相关文档生成答案。
端侧模型通常是指部署在手机、电脑、汽车或其他电子产品的轻量化模型,电子产品对于端侧模型的能耗、散热等方面有着严格要求。最近一段 时间,国内外硬件厂商推出的终端产品(如手机、汽车等)逐步搭载端侧AI模型,如三星手机Galaxy Z系列、谷歌手机Pixel 9系列,小米汽车su7 等。未来模型能力与终端产品紧密结合,给消费者带来更为便捷的智能使用体验。需要关注的是,端侧模型需要平衡运行效率与功耗的关系,模 型在端侧设备运行方面同样需要优化。总体而言,端侧模型的发展前景广阔,需要持续迭代以满足不同场景的特定需求。