2024年联想混合云智能运维实践研究:GenAI赋能下的运维转型与创新

  • 来源:其他
  • 发布时间:2025/04/03
  • 浏览次数:240
  • 举报
相关深度报告REPORTS

2024AI+研发数字峰会:基于GenAI的混合云智能运维实践.pdf

2024AI+研发数字峰会:基于GenAI的混合云智能运维实践。

随着数字化转型的加速,混合云架构已成为企业IT基础设施的重要组成部分。联想作为全球领先的科技企业,在混合云智能运维领域进行了深入的探索和实践。本文将从联想混合云智能运维的发展历程、GenAI技术在智能运维中的应用、运维场景的创新实践以及未来展望等角度,深入分析联想在混合云智能运维领域的转型与创新。

一:联想混合云智能运维的发展历程

联想的混合云智能运维发展历程可以追溯到1998年,当时联想正处于信息化建设的初期阶段,主要通过实施ERP和OA系统来提升企业的管理效率。2005年至2016年,联想进入全球化与数字化阶段,开始整合全球战略平台,逐步实现数据中心的虚拟化和部分云化。这一时期,联想的运维模式从手工操作逐步转向自动化平台,开发效率和资源交付效率显著提升。

2017年至今,联想进入智能化阶段,全面建设全球智能化平台。在这一阶段,联想的混合云智能运维取得了突破性进展。联想通过构建统一的大数据平台和数据治理架构,实现了数据的集中管理和智能应用。同时,联想引入了AIOps技术,推动了运维从传统模式向数据驱动的智能运维转型。联想的运维效率大幅提升,自动化率达到50%以上,资源交付效率提高了60倍,SLA(服务水平协议)达到99.99%以上,重大故障减少了30%。

联想在全球范围内建立了多个数据中心,包括私有云数据中心、边缘数据中心和公有云数据中心,覆盖了北京、德国法兰克福、美国弗吉尼亚、巴西圣保罗、新加坡、宁夏、香港、武汉等多个地区。这些数据中心的建设和运营,为联想的全球业务提供了强大的IT支持。同时,联想通过混合云架构,实现了资源的灵活调配和高效利用,进一步提升了企业的竞争力。

二:GenAI混合云智能运维架构与技术应用

联想的GenAI混合云智能运维架构以数据驱动的智能分析为核心,结合可观测的监控告警和任务驱动的自动化平台,实现了混合云环境的端到端智能管理。联想xCloud AIOps是这一架构的核心产品,它通过整合判别式AI和生成式AI技术,为企业提供了一体化的智能运维解决方案。

在技术应用方面,联想xCloud AIOps涵盖了从异常检测、根因分析到成本控制和资源优化的多个智能运维场景。例如,通过智能分析平台,联想能够实现对基础设施的全面监控,包括服务器、网络、存储等设备的性能指标和日志数据。基于机器学习算法,联想能够对这些数据进行实时分析,快速检测出异常情况,并通过根因分析技术准确定位问题的根源,从而实现故障的快速修复。

此外,联想还引入了生成式AI技术,开发了智小星(xSpark)这一IT运营智能体。智小星能够嵌入或集成到xCloud AIOps产品中,为企业提供基于领域知识的智能问答、代码生成、任务自动化执行等服务。通过智小星,联想实现了运维任务的自动化执行,提高了运维效率,降低了人力成本。

在运维数据管理方面,联想构建了运维数据湖平台,实现了运维数据的集中存储和管理。通过数据抽取、存储、管理和洞察等技术,联想能够对海量的运维数据进行深度分析,挖掘数据中的价值,为运维决策提供支持。同时,联想还通过智能可视化平台,将运维数据以直观的图表形式展示出来,帮助运维人员快速了解系统的运行状态。

三:GenAI赋能的智能运维应用场景

联想在GenAI赋能的智能运维应用场景中进行了大量的创新实践。例如,在运维故障解决推荐方面,联想通过运维大模型结合RAG技术,结合运维告警信息以及企业内部历史解决方案沉淀,提供定制化的洞察和准确的解决方案建议。这一方案在警报和事件分析中提高了18%的效率,显著提升了系统的可靠性和运维人员的响应速度。

在智能运维工具池方面,联想通过智能体实现了用户自服务,提高了用户自助服务率,减少了操作人员的工作量。例如,运维执行助手能够自动执行常规运维任务,如资产查询、智能巡检、运维报表查询等,提高了运维任务执行效率22%。此外,联想还通过GenAI支持的运维脚本开发,辅助生成自动化操作脚本,提高了脚本开发效率11%,降低了运维编码门槛。

在智能可观测性方面,联想通过AI赋能的监控工具,实现了对系统内部状态、行为和性能的全面观察、分析和监控。例如,通过智能检测/预测技术,联想能够实现指标趋势预测、智能日志异常检测、容量需求预测等功能,帮助运维人员提前发现潜在问题,降低故障发生概率。同时,通过AI驱动的告警压缩和事件去重技术,联想能够减少告警信息的冗余,提高告警处理效率。

在运营数据洞察方面,联想利用生成式AI技术,打造了运营数据查询与分析助手,让用户能够轻松实现运营数据报表的构建与分析洞察。通过拖拉拽配置方式,用户可以快速完成数据接入与建模,并自动生成查询SQL。同时,联想还通过智能主题推荐和对话式智能分析技术,帮助用户快速生成分析报告,提升数据决策效率。

四:实践经验与未来展望

在GenAI智能运维的实践经验方面,联想总结出了一系列关键策略。例如,在模型选择上,联想根据不同的应用场景,灵活选择开源模型和闭源模型。对于小型和中型企业,联想倾向于选择开源模型,因为它们具有启动成本低、迭代更新快等优点;而对于大型和超大型企业,联想则更倾向于选择闭源模型,因为它们在模型先进性、稳定性和安全性等方面更具保障。

在工程落地方面,联想构建了模型运维追踪体系,通过量化指标定义模型表现,持续优化提升AI场景表现。同时,联想还针对RAG在AIOps领域遇到的挑战,如模型的过度生成、术语理解差、无法提供用户满意答复等问题,提出了相应的解决方案。例如,通过意图识别、领域词汇表开发、知识库扩充等手段,联想提高了模型的理解能力和响应准确性。

展望未来,联想认为GenAI智能运维的应用场景将逐渐从嵌入模式、助理模式升级到智能体模式。在智能体模式下,AI将在设定的目标和权限内自主规划和执行任务,人类则在出现异常时进行干预。这种模式将极大地提升企业的运维效率和运营质量,助力企业实现智能卓越运营。

以上就是关于联想混合云智能运维实践的分析。联想通过多年的探索和创新,在混合云智能运维领域取得了显著的成就。从早期的信息化建设到如今的智能化运维,联想不仅实现了运维效率的大幅提升,还通过GenAI技术的应用,为企业提供了更加智能化的运维解决方案。未来,随着GenAI技术的不断发展,联想有望在智能运维领域继续保持领先地位,推动企业IT运营向更高层次发展。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告
评论
  • 相关文档
  • 相关文章
  • 最新文档
  • 最新精读
分享至