模型发展现状及应用展望分析

提问时间：2024/12/06
浏览次数：253
提问者：匿名用户
举报
分享微信 QQ 微博

模型发展现状及应用展望分析

标签

模型

共有1个回答
关注问题
我来回答

最佳答案由匿名用户编辑于2024/12/06 14:43

端侧小模型发展加速。

我们预测，小参数模型将拥有更广泛的应用场景发展。目前有许多应用场景面临端侧算力受限的情况，譬如在离线终端设备上运行大模型，此时我们只能使用参数量较小的小模型。在未来，除了 AIPC 与手机，小模型还可能部署在汽车、机器人等终端上，因此定性看，小模型的训练和推理需求依旧较高。当前，Google 的 Gemini Nano 模型是典型代表，其包含 1.8B 和 3.25B 两个版本，已经实现在 Pixel 8 Pro 手机上的部署；此外也有开源的 Mixtral 8*7B，在多项测评中表现甚至超过了 GPT-3.5。另一个趋势是，厂商在尝试将性能较好的大模型通过“蒸馏“等训练方法进行参数量的压缩，使其迁移到参数量更小的模型上去。譬如 Google 发布的 Gemini 1.5 Flash 就是在 Gemini Pro 的基础上得到，在相近的模型性能之下求得更快的响应速度，10 月份更是推出了 Gemini 1.5 Flash-8B，进一步追求参数量的缩减。

除了以上几点之外，其他诸如 Agent 的应用研究、RAG 技术的广泛应用等也都是大模型相关研究的发展前景，我们也在此前的报告中提及。模型自身的效果提升也将进一步推进应用研究，大模型在金融领域的应用方面也同样有开阔的展望空间。

伴随大模型响应速度的提升、交互能力的增强，我们判断未来将有大量相关应用快速落地。在教育、医疗、办公、游戏等领域，大模型将凭借出色的交互能力发挥优势，提供软件类应用。以教育为例，在大模型辅助下传统的线上教育将更加便利，可以轻松针对不同的学习者制定一对一计划，且更贴近真人的交互体验将使得教育效果明显提升；在数学、编程等课程上，大模型还将发挥其逻辑推理的优势，帮助使用者更好完成学习任务。除了纯软件形式的服务，若我们赋予大模型环境交互能力，也能带来“具身智能”类型的应用。这类应用允许大模型通过接口直接操作现实物体。当前业界正在探索的人形机器人、智能座舱和智能家居等，正属于这一类型。比如 Figure AI 与 OpenAI 合作推出的人形机器人，实现了人类语言控制机器人进行实际操作，背后就是借助了大模型来实现语义理解、指令生成等步骤。

而在金融领域，我们认为大模型同样拥有广泛的应用空间。大模型为挖掘非结构化数据打开了丰富的想象空间。此前 BERT、TF-IDF 等传统的 NLP 模型只能针对文本进行简单的情感判断和语义识别任务，判断准确度一般且使用方法单一，只适用于构建舆情策略。相比之下，大模型的能力圈更广泛，可完成的任务也更多样。

大模型可以为为日常工作带来诸多便利。我们可以使用大模型来帮助报告阅读、纪要整理等，减轻日常工作的负荷。借由大模型对文本的整理与分析能力，我们能从文本中自动找出关键的观点段落，或是让大模型对研报、纪要进行总结，提升寻找关键信息的效率。除了辅助日常工作之外，大模型也可以为专业投资工作带来帮助，将投资判断的流程大幅度自动化。譬如我们需要汇总不同证券研究团队对市场、行业的判断，就可以通过大模型批量化读取文件，并按照设计好的提示词模板从文件中提取我们需要的观点部分，最后对全市场的报告观点进行汇总，总结当前各机构观点之间的共性与分歧。这一流程省去了我们大批量的重复性工作，提升效率。

此外，大模型同样可以应用于报告撰写、交易询价、合规风控、智能问答等金融场景中，起到为从业者提升工作效率的作用，这些都属于大模型为日常工作的赋能范围。实际上，当前已有许多这方面的应用推出，譬如辅助读研报的 WarrenQ、AlphaEngine，辅助分析会议纪要的 Alpha 派等，都是较成熟的大模型投研赋能工具。我们认为未来将会有更多类似的大模型应用或产品出现，提供其他金融场景解决方案。

除了使用大模型辅助投资工作外，我们还可以使用大模型给出投资决策，搭建完整的投资策略。两者的区别在于，后者与投资的结合更加紧密，且通常需要借助 Agent 概念搭建一个复杂的系统来完成任务。最简单的，我们可以发挥大语言模型对文本情感的识别能力，用于判断新闻、论坛评论等文本数据的情感倾向，并最终综合出量化打分，由此构建选股或择时策略。相比之下，大模型对文本情感判断更准确，得到的策略效果更好。实际上，这是大模型较为初级的使用方法，并没有跳脱出传统 NLP 模型在投资领域的应用思路，也没有完全发挥出大模型的优势。我们在此给出另一个大模型用于投资决策生成的案例：热点概念解构。我们可以设计一个 Agent 专门用于梳理投资概念的产业链上下游图谱与概念股结果。针对我们指定的任意概念名称，它能模仿人类研究员自动搜索相关的研报、新闻等信息作为补充的知识，并从中梳理出产业链上下游结构，再更进一步从文本中识别出相关的概念股。对一些刚出现的概念，这一应用能帮助投资者在短时间内快速把握投资概念，不错过潜在的投资机会。

国金金融工程团队已在大模型研究方面进行布局，并不断探索大模型应用的前沿场景。目前我们已经基于大模型实现了纪要研报分析、核心信息提取、数据智能筛选、热点投资解构等多项成果，我们认为可以构建大模型应用来完成以下任务中的投资决策生成：行业投研智能体设计、宏观产业政策解析、定性+定量智能化选基框架。

我们预测，2025 年也将有更多类似的基于大模型的投资策略或工具被设计出来，在各细分领域帮助投资者提升效率。

参考报告

金融工程2025年度策略：LLM破局Alpha困境，拥抱Beta大时代.pdf

金融工程2025年度策略：LLM破局Alpha困境，拥抱Beta大时代。大模型加速迭代，开启智能投研新纪元。展望2025年，我们认为交互式多模态大语言模型将会成为主流,满足更多样的使用需求，开拓更为丰富的应用场景。未来强化学习和“思维链”技术的运用将会是智能提升的主要方法，会显著提升模型在长线程思维问题的表现。在训练数据方面，虽目前还没触及理论上限，但在不远的将来，数据量的不足可能会成为大模型发展的主要限制。此外我们预测端侧小模型将会有更广泛的应用场景，伴随大模型响应速度的提升、交互能力的增强，我们判断未来将有大量相关应用快速落地。大模型可以为主动投研赋能，提升工作效率...

查看详情

模型发展现状及应用展望分析

金融工程2025年度策略：LLM破局Alpha困境，拥抱Beta大时代.pdf

商业火箭目前发展到什么阶段了？

康耐特光学有哪些业务布局？

AI眼镜行业规模、需求、成长性、格局及竞争要素在哪？

康耐特光学发展历程、股权结构及收入分析

中宠股份经营看点在哪？

中宠股份发展历程、股权结构及营收分析

赛微电子发展历程、股权结构、主营业务、研发及财务分析

梦百合内外销业务进展如何？

沃巴查芒

每日新报

StartYourFinance

999感冒灵

王中王