计算机行业专题报告:多模态大模型技术演进及研究框架.pdf

  • 上传者:7***
  • 时间:2023/03/20
  • 热度:3054
  • 0人点赞
  • 举报

计算机行业专题报告:多模态大模型技术演进及研究框架。核心观点:Transformer颠覆了传统深度学习模型,但仅限于文本,ViT打通了Transformer与CV领域的壁垒, BEiT模型将生成式预训练引入CV领域, 基于ViT的多模态模型涌现。多模态已经在多个领域中得到广泛应用,如虚拟人、智能座舱、机器人等,各式应用持续推动多模态模型的演进。近 期OpenAI发布能处理图像和文本的多模态模型GPT-4,引发关注,随着底座模型推出,上层应用预计将会涌现,催生巨大商业市场,我们建议关注。

ViT打通了Transformer与CV领域的壁垒, BEiT模型将生成式预训练引入CV领域。Transformer的出现颠覆传统深度学习模型,BERT等证明了 Transformer在NLP领域的优秀表现。然而传统的Transformer模型只适用于单模态文本,ViT模型将patch embedding引入Transformer,打通了 Transformer与CV领域的壁垒。以ViT为基础的多模态模型如雨后春笋般涌现,以文图多模态为主,视频领域也产生了许多基于ViT的模型。生成式 预训练被证明在自然语言处理领域有着广泛的应用,BEiT模型将生成式预训练引入CV领域,实现了CV领域大规模自监督预训练。

多模态发展经历五个阶段,包括行为时代、计算时代、交互时代、深度学习时代和大模型时代。多模态交互、感知、内容分发等应用已涉及多个 方面,包括多模态检索、虚拟人、智能人、智能座舱、语音助手等。扩散模型等和多模态模型的结合催生了文生图任务的火爆。各式多模态场景 下的应用持续推动多模态模型的演进。

多模态预训练大模型核心要素包括:对图文编码、设置学习目标、模型结构、模态融合等。多模态预训练模型首先要将图文进行编码,文字端有 成熟的BERT等模型进行处理,图像特征基于Patch提取更加高效。学习目标是多模态预训练大模型重要一环,包括图文对比、编码语言模型、图文 匹配等,模型可以使用不同的学习目标产生不同学习效果。多模态预训练大模型结果主要分为encoder-only和encoder-decoder,常见的是encoderonly模型,用于图文检索等任务,而后者适用于生成任务。根据模态融合方式不同,又可以分为fusion encoder和dual encoder模型,前者通过混合方 式对模态进行处理,能够学习到不同模态之间的隐藏的知识,适合推理,后者分别对模态进行处理,适合检索等任务。

多模态预训练大模型未来将更加统一。虽然BEiT-3等统一模型将各种任务统一起来,但实际上仅仅是将几个任务的模块累加起来得到的,并非真正 意义上的“统一”。未来,以微软发布的KOSMOS-1和谷歌发布的PaLM-E,将不同模态统一编码为文本模式或者使用通才模型统一下游任务使多 模态预训练大模型走向统一。

1页 / 共51
计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第1页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第2页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第3页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第4页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第5页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第6页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第7页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第8页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第9页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第10页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第11页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第12页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第13页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第14页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第15页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第16页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第17页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第18页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第19页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第20页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第21页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第22页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第23页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第24页 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf第25页
  • 格式:pdf
  • 大小:5.5M
  • 页数:51
  • 价格: 8积分
下载 获取积分

免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。

留下你的观点
  • 相关标签
  • 相关专题
热门下载
  • 全部热门
  • 本年热门
  • 本季热门
分享至