北京大学-DeepSeek原理与落地应用

来源：北京大学
发布时间：2025/03/17
浏览次数：240
举报

相关深度报告REPORTS

北京大学-DeepSeek原理与落地应用.pdf

北京大学-DeepSeek原理与落地应用。01人工智能概念辨析；02DeepSeekR1；03大模型原理；04落地应用。

由北京大学发布了《北京大学-DeepSeek原理与落地应用》这篇报告。以下是对该报告的简单概括，更多内容请前往原报告进行下载查看。DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，成立于2023年7月17日，是一家创新型科技企业，专注于人工智能基础技术的研究与开发。

人工智能：让机器具备动物智能，人类智能，非人类智能（超人类智能） •运算推理：规则核心；自动化 •知识工程：知识核心；知识库+推理机。

机器学习：学习核心；数据智能（统计学习方法，数据建模） •常规机器学习方法：逻辑回归，决策森林，支持向量机，马尔科夫链，…..

人工神经网络：与人脑最大的共同点是名字，机制和架构并不一样 •传统神经网络：霍普菲尔德网络，玻尔兹曼机，….. •深度神经网络：深度学习 •传统网络架构：DBN，CNN，RNN，ResNet，Inception，…… •Transformer架构：可以并行矩阵计算（GPU），核心是注意力机制（Attention） •编码器（BERT）：多数embedding模型，Ernie早期版本，……. •混合网络：T5、GLM •解码器（GPT）：大语言模型（LLM），也是传统的多模态模型的核心。

DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，成立于2023年7月17日，是一家创新型科技企业，专注于人工智能基础技术的研究与开发。

DeepSeek专注于开发先进的大语言模型(LLM)和相关技术，旨在通过这些技术推动人工智能在多个领域的应用和创新。

DeepSeek R1达到了跟o1相当、或者至少接近的推理能力，且将推理过程可视化 • 它做到这个水平只用到少得多的资源，所以价格十分便宜 • 它是完全开源的并且还发布论文，详细介绍了训练中所有的步骤和窍门 • DeepSeek深度求索公司是一家纯粹的中国公司。

DeepSeek让人类与AI对话更加简单，提示词让对话质量提升立竿见影，适合所有层级使用者快速上手。 DeepSeek的深度思考模式基于DeepSeek R1模型，是一种推理模型。相比较于传统的生成模型，使用DeepSeek R1模型时的提示词技巧有较大的变化。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）