计算机行业专题报告:多模态大模型技术演进及研究框架.pdf
- 上传者:7***
- 时间:2023/03/20
- 热度:3054
- 0人点赞
- 举报
计算机行业专题报告:多模态大模型技术演进及研究框架。核心观点:Transformer颠覆了传统深度学习模型,但仅限于文本,ViT打通了Transformer与CV领域的壁垒, BEiT模型将生成式预训练引入CV领域, 基于ViT的多模态模型涌现。多模态已经在多个领域中得到广泛应用,如虚拟人、智能座舱、机器人等,各式应用持续推动多模态模型的演进。近 期OpenAI发布能处理图像和文本的多模态模型GPT-4,引发关注,随着底座模型推出,上层应用预计将会涌现,催生巨大商业市场,我们建议关注。
ViT打通了Transformer与CV领域的壁垒, BEiT模型将生成式预训练引入CV领域。Transformer的出现颠覆传统深度学习模型,BERT等证明了 Transformer在NLP领域的优秀表现。然而传统的Transformer模型只适用于单模态文本,ViT模型将patch embedding引入Transformer,打通了 Transformer与CV领域的壁垒。以ViT为基础的多模态模型如雨后春笋般涌现,以文图多模态为主,视频领域也产生了许多基于ViT的模型。生成式 预训练被证明在自然语言处理领域有着广泛的应用,BEiT模型将生成式预训练引入CV领域,实现了CV领域大规模自监督预训练。
多模态发展经历五个阶段,包括行为时代、计算时代、交互时代、深度学习时代和大模型时代。多模态交互、感知、内容分发等应用已涉及多个 方面,包括多模态检索、虚拟人、智能人、智能座舱、语音助手等。扩散模型等和多模态模型的结合催生了文生图任务的火爆。各式多模态场景 下的应用持续推动多模态模型的演进。
多模态预训练大模型核心要素包括:对图文编码、设置学习目标、模型结构、模态融合等。多模态预训练模型首先要将图文进行编码,文字端有 成熟的BERT等模型进行处理,图像特征基于Patch提取更加高效。学习目标是多模态预训练大模型重要一环,包括图文对比、编码语言模型、图文 匹配等,模型可以使用不同的学习目标产生不同学习效果。多模态预训练大模型结果主要分为encoder-only和encoder-decoder,常见的是encoderonly模型,用于图文检索等任务,而后者适用于生成任务。根据模态融合方式不同,又可以分为fusion encoder和dual encoder模型,前者通过混合方 式对模态进行处理,能够学习到不同模态之间的隐藏的知识,适合推理,后者分别对模态进行处理,适合检索等任务。
多模态预训练大模型未来将更加统一。虽然BEiT-3等统一模型将各种任务统一起来,但实际上仅仅是将几个任务的模块累加起来得到的,并非真正 意义上的“统一”。未来,以微软发布的KOSMOS-1和谷歌发布的PaLM-E,将不同模态统一编码为文本模式或者使用通才模型统一下游任务使多 模态预训练大模型走向统一。
免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。
- 相关标签
- 相关专题
- 全部热门
- 本年热门
- 本季热门
- 华为鲲鹏产业体系研究深度报告:鲲鹏展翅,挥下千亿市场.pdf 6899 9积分
- 计算机行业研究及2020年投资策略(103页).pdf 5874 10积分
- 国产计算机基础软硬件行业深度报告:重构中国IT产业生态.pdf 5384 9积分
- 计算机行业深度分析:国产软件大阅兵.pdf 3883 8积分
- 国产操作系统产业分析报告:国魂所系,任重道远.pdf 3680 8积分
- 网络安全服务行业研究报告:网络安全行业的制高点 3651 10积分
- 计算机操作系统的历史演进和未来趋势.pdf 3262 8积分
- 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf 3054 8积分
- 计算机行业2020年度投资策略报告(87页).pdf 2265 6积分
- 2020年计算机行业中期策略:疫情和中美脱钩对行业意味着什么.pdf 2213 8积分
- 计算机行业2025年三季报业绩综述:业绩趋势向好,关注AI+与信创主题.pdf 1374 4积分
- 计算机行业从Circle和Coinbase看稳定币产业链:稳定币+RWA,迈向Finternet的关键.pdf 818 8积分
- 计算机行业“智能驾驶”系列专题报告:域控制器研究框架.pdf 619 7积分
- 计算机行业专题研究:DeepSeek重构算力基建长期价值的认知.pdf 539 6积分
- 计算机行业专题报告:物理AI,AI技术演进新方向,赋能产业智能化升级.pdf 538 6积分
- 计算机行业深度研究报告:字节跳动,深度布局AIGC,竞逐新一轮技术浪潮.pdf 524 6积分
- 计算机行业分析:国产算力迎来GB200时刻,AI交换网络是核心增量.pdf 513 7积分
- 计算机行业深度报告:脑机接口,从概念到落地,开启交互新时代.pdf 504 6积分
- 计算机行业深度研究:软件大革命深度,AI Agent投资宝典.pdf 492 20积分
- 计算机行业“AI+金融”系列专题研究:行业拐点已至,金融是AI应用落地的绝佳“试验田”.pdf 421 5积分
- 计算机行业:NV Rubin新架构&Agent存储最强方向,GPU Native数据库【星环科技】.pdf 391 4积分
- 计算机行业AI应用系列:3D打印百花齐放,国产厂商持续突破.pdf 339 6积分
- 计算机行业:从智谱华章MiniMax IPO看产业机遇,国内AI产业机遇期来临.pdf 303 4积分
- 计算机行业专题研究:千问APP正式接入阿里生态,流量模型AI应用产业格局有望重构.pdf 287 3积分
- 计算机行业:SpaceX如何值万亿美元?.pdf 283 4积分
- 计算机行业AI编程:重塑软件开发新范式,应用生态加速繁荣.pdf 270 4积分
- 计算机行业专题报告:GPU+ASIC渗透加速,液冷市场规模再添增量.pdf 258 5积分
- 计算机行业:AI编程商业化加速,关注本土产业参与方.pdf 256 3积分
- 计算机行业:SpaceX,从“变革”中崛起的“星际先行者”.pdf 246 4积分
- 计算机行业共享出行:迈向高质量发展,Robotaxi开启新篇章.pdf 229 4积分
