北京大学-DeepSeek原理与落地应用

  • 来源:北京大学
  • 发布时间:2025/03/17
  • 浏览次数:240
  • 举报
相关深度报告REPORTS

北京大学-DeepSeek原理与落地应用.pdf

北京大学-DeepSeek原理与落地应用。01人工智能概念辨析;02DeepSeekR1;03大模型原理;04落地应用。

由北京大学发布了《北京大学-DeepSeek原理与落地应用》这篇报告。以下是对该报告的简单概括,更多内容请前往原报告进行下载查看。DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技企业,专注于人工智能基础技术的研究与开发。

人工智能:让机器具备动物智能,人类智能,非人类智能(超人类智能) •运算推理:规则核心;自动化 •知识工程:知识核心;知识库+推理机 。

机器学习:学习核心;数据智能(统计学习方法,数据建模) •常规机器学习方法:逻辑回归,决策森林,支持向量机,马尔科夫链,…..

人工神经网络:与人脑最大的共同点是名字,机制和架构并不一样 •传统神经网络:霍普菲尔德网络,玻尔兹曼机,….. •深度神经网络:深度学习 •传统网络架构:DBN,CNN,RNN,ResNet,Inception,…… •Transformer架构:可以并行矩阵计算(GPU),核心是注意力机制(Attention) •编码器(BERT):多数embedding模型,Ernie早期版本,……. •混合网络:T5、GLM •解码器(GPT):大语言模型(LLM),也是传统的多模态模型的核心。

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技企业,专注于人工智能基础技术的研究与开发。

DeepSeek专注于开发先进的大语言模型(LLM)和相关技术,旨在通过这些技术推动人工智能在多个领域的应用和创新。

DeepSeek R1达到了跟o1相当、或者至少接近的推理能力,且将推理过程可视化 • 它做到这个水平只用到少得多的资源,所以价格十分便宜 • 它是完全开源的并且还发布论文,详细介绍了训练中所有的步骤和窍门 • DeepSeek深度求索公司是一家纯粹的中国公司。

DeepSeek让人类与AI对话更加简单,提示词让对话质量提升立竿见影,适合所有层级使用者快速上手。 DeepSeek的深度思考模式基于DeepSeek R1模型,是一种推理模型。相比较于传统的生成模型,使用DeepSeek R1模型时的提示词技巧有较大的变化。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告
评论
  • 相关标签
  • 相关专题
  • 相关文档
  • 相关文章
  • 全部热门
  • 本年热门
  • 本季热门
  • 最新文档
  • 最新精读
分享至