模型发展现状及应用展望分析

模型发展现状及应用展望分析

最佳答案 匿名用户编辑于2024/12/06 14:43

端侧小模型发展加速。

我们预测,小参数模型将拥有更广泛的应用场景发展。目前有许多应用场景面临端侧算力 受限的情况,譬如在离线终端设备上运行大模型,此时我们只能使用参数量较小的小模型。 在未来,除了 AIPC 与手机,小模型还可能部署在汽车、机器人等终端上,因此定性看, 小模型的训练和推理需求依旧较高。 当前,Google 的 Gemini Nano 模型是典型代表,其包含 1.8B 和 3.25B 两个版本,已经实 现在 Pixel 8 Pro 手机上的部署;此外也有开源的 Mixtral 8*7B,在多项测评中表现甚 至超过了 GPT-3.5。 另一个趋势是,厂商在尝试将性能较好的大模型通过“蒸馏“等训练方法进行参数量的压 缩,使其迁移到参数量更小的模型上去。譬如 Google 发布的 Gemini 1.5 Flash 就是在 Gemini Pro 的基础上得到,在相近的模型性能之下求得更快的响应速度,10 月份更是推 出了 Gemini 1.5 Flash-8B,进一步追求参数量的缩减。

除了以上几点之外,其他诸如 Agent 的应用研究、RAG 技术的广泛应用等也都是大模型相 关研究的发展前景,我们也在此前的报告中提及。模型自身的效果提升也将进一步推进应 用研究,大模型在金融领域的应用方面也同样有开阔的展望空间。

伴随大模型响应速度的提升、交互能力的增强,我们判断未来将有大量相关应用快速落地。 在教育、医疗、办公、游戏等领域,大模型将凭借出色的交互能力发挥优势,提供软件类 应用。以教育为例,在大模型辅助下传统的线上教育将更加便利,可以轻松针对不同的学 习者制定一对一计划,且更贴近真人的交互体验将使得教育效果明显提升;在数学、编程 等课程上,大模型还将发挥其逻辑推理的优势,帮助使用者更好完成学习任务。 除了纯软件形式的服务,若我们赋予大模型环境交互能力,也能带来“具身智能”类型的 应用。这类应用允许大模型通过接口直接操作现实物体。当前业界正在探索的人形机器人、 智能座舱和智能家居等,正属于这一类型。比如 Figure AI 与 OpenAI 合作推出的人形机 器人,实现了人类语言控制机器人进行实际操作,背后就是借助了大模型来实现语义理解、 指令生成等步骤。

而在金融领域,我们认为大模型同样拥有广泛的应用空间。大模型为挖掘非结构化数据打 开了丰富的想象空间。此前 BERT、TF-IDF 等传统的 NLP 模型只能针对文本进行简单的情 感判断和语义识别任务,判断准确度一般且使用方法单一,只适用于构建舆情策略。相比 之下,大模型的能力圈更广泛,可完成的任务也更多样。

大模型可以为为日常工作带来诸多便利。我们可以使用大模型来帮助报告阅读、纪要整理 等,减轻日常工作的负荷。借由大模型对文本的整理与分析能力,我们能从文本中自动找 出关键的观点段落,或是让大模型对研报、纪要进行总结,提升寻找关键信息的效率。 除了辅助日常工作之外,大模型也可以为专业投资工作带来帮助,将投资判断的流程大幅 度自动化。譬如我们需要汇总不同证券研究团队对市场、行业的判断,就可以通过大模型 批量化读取文件,并按照设计好的提示词模板从文件中提取我们需要的观点部分,最后对 全市场的报告观点进行汇总,总结当前各机构观点之间的共性与分歧。这一流程省去了我 们大批量的重复性工作,提升效率。

此外,大模型同样可以应用于报告撰写、交易询价、合规风控、智能问答等金融场景中, 起到为从业者提升工作效率的作用,这些都属于大模型为日常工作的赋能范围。 实际上,当前已有许多这方面的应用推出,譬如辅助读研报的 WarrenQ、AlphaEngine,辅 助分析会议纪要的 Alpha 派等,都是较成熟的大模型投研赋能工具。我们认为未来将会有 更多类似的大模型应用或产品出现,提供其他金融场景解决方案。

除了使用大模型辅助投资工作外,我们还可以使用大模型给出投资决策,搭建完整的投资 策略。两者的区别在于,后者与投资的结合更加紧密,且通常需要借助 Agent 概念搭建一 个复杂的系统来完成任务。 最简单的,我们可以发挥大语言模型对文本情感的识别能力,用于判断新闻、论坛评论等 文本数据的情感倾向,并最终综合出量化打分,由此构建选股或择时策略。相比之下,大 模型对文本情感判断更准确,得到的策略效果更好。实际上,这是大模型较为初级的使用 方法,并没有跳脱出传统 NLP 模型在投资领域的应用思路,也没有完全发挥出大模型的优 势。 我们在此给出另一个大模型用于投资决策生成的案例:热点概念解构。我们可以设计一个 Agent 专门用于梳理投资概念的产业链上下游图谱与概念股结果。针对我们指定的任意概 念名称,它能模仿人类研究员自动搜索相关的研报、新闻等信息作为补充的知识,并从中 梳理出产业链上下游结构,再更进一步从文本中识别出相关的概念股。对一些刚出现的概 念,这一应用能帮助投资者在短时间内快速把握投资概念,不错过潜在的投资机会。

国金金融工程团队已在大模型研究方面进行布局,并不断探索大模型应用的前沿场景。目 前我们已经基于大模型实现了纪要研报分析、核心信息提取、数据智能筛选、热点投资解 构等多项成果,我们认为可以构建大模型应用来完成以下任务中的投资决策生成:行业投 研智能体设计、宏观产业政策解析、定性+定量智能化选基框架。

我们预测,2025 年也将有更多类似的基于大模型的投资策略或工具被设计出来,在各细 分领域帮助投资者提升效率。

参考报告

金融工程2025年度策略:LLM破局Alpha困境,拥抱Beta大时代.pdf

金融工程2025年度策略:LLM破局Alpha困境,拥抱Beta大时代。大模型加速迭代,开启智能投研新纪元。展望2025年,我们认为交互式多模态大语言模型将会成为主流,满足更多样的使用需求,开拓更为丰富的应用场景。未来强化学习和“思维链”技术的运用将会是智能提升的主要方法,会显著提升模型在长线程思维问题的表现。在训练数据方面,虽目前还没触及理论上限,但在不远的将来,数据量的不足可能会成为大模型发展的主要限制。此外我们预测端侧小模型将会有更广泛的应用场景,伴随大模型响应速度的提升、交互能力的增强,我们判断未来将有大量相关应用快速落地。大模型可以为主动投研赋能,提升工作效率...

查看详情
相关报告
我来回答