【人工智能通识专栏】第二讲:学会使用DeepSeek

【人工智能通识专栏】第二讲:学会使用DeepSeek

DeepSeek是中国AI公司深度求索(DeepSeek AI)开发的开源大型语言模型系列,以高性价比、强大推理能力和开源精神著称。截至2026年初,DeepSeek已成为全球最受欢迎的开源LLM之一,尤其在数学、代码和复杂推理任务上表现出色,常被视为OpenAI o1系列的开源替代品。其代表模型包括DeepSeek-V3(通用模型)和DeepSeek-R1(专注重推理模型),最新版本如V3.2进一步优化了代理(Agent)能力和工具调用。

本讲聚焦实用:如何快速上手DeepSeek,包括网页聊天、API调用和本地部署。无论你是初学者还是开发者,都能轻松掌握。

1. DeepSeek简介与核心优势

  • 主要模型
  • DeepSeek-V3系列:MoE(专家混合)架构,总参数671B,仅激活37B,高效且成本低。适合日常聊天、写作、代码生成。最新V3.2(2025年底发布)强化了“思考模式”和工具集成,适用于构建AI代理。
  • DeepSeek-R1系列:基于V3,通过大规模强化学习(RL)训练,擅长逐步推理。性能媲美OpenAI o1,在数学(AIME)和代码基准上领先开源模型。
  • 优势
  • 开源(MIT许可),支持商业使用和修改。
  • 价格极低:API调用远低于GPT系列。
  • 高性能:推理能力强,支持长上下文(128K+ tokens)。
  • 社区活跃:Hugging Face上有大量衍生模型。

官方网站:https://www.deepseek.com/ 或 https://platform.deepseek.com/(API平台)
聊天界面:https://chat.deepseek.com/

2. 最简单方式:网页聊天界面

无需注册或安装,直接浏览器使用。

  1. 打开 https://chat.deepseek.com/
  2. 选择模型:
  • DeepSeek-V3.2:通用任务,速度快。
  • DeepSeek-R1(或开启“DeepThink”/思考模式):复杂推理、数学、代码。
  1. 输入问题,开始对话。
  • 支持文件上传(文档分析)、长对话。
  • 对于推理任务,建议提示模型“逐步思考”或直接选R1模式。

示例提示(数学题):

使用DeepSeek-R1:一步步思考,解决这个方程:x^3 – 6x^2 + 11x – 6 = 0

网页版免费额度充足,适合学习和日常使用。

3. 通过API使用(开发者推荐)

DeepSeek API兼容OpenAI格式,切换base_url即可无缝迁移代码。

  1. 注册与获取API Key
  • 访问 https://platform.deepseek.com/
  • 注册账号,获取API Key(免费额度高,付费超低价)。
  1. 模型名称
  • 通用:deepseek-chat (V3.2)
  • 推理:deepseek-reasoner (R1系列)
  1. Python示例(使用OpenAI SDK):
   from openai import OpenAI

   client = OpenAI(
       api_key="your_deepseek_api_key",
       base_url="https://api.deepseek.com"
   )

   response = client.chat.completions.create(
       model="deepseek-chat",  # 或 "deepseek-reasoner"
       messages=[
           {"role": "system", "content": "你是一个helpful助手。"},
           {"role": "user", "content": "解释量子计算的基本原理,并举例。"}
       ],
       stream=False  # 支持流式输出
   )

   print(response.choices[0].message.content)
  • 对于推理模型,可添加参数启用“thinking”模式(更高推理努力)。

API支持工具调用、JSON输出,适合集成到App或代理系统中。

4. 本地运行DeepSeek(高级用户)

DeepSeek模型开源,可在个人电脑/服务器运行(需足够GPU)。

  1. 推荐工具
  • Ollama:最简单(支持Mac/Windows/Linux)。
    • 安装Ollama:https://ollama.com/
    • 运行:ollama run deepseek-r1ollama run deepseek-v3
  • LM StudioOpen WebUI:提供ChatGPT-like界面,支持文件上传。
  • Hugging Face 下载权重:https://huggingface.co/deepseek-ai
  1. 硬件要求
  • 小型蒸馏版(7B/8B):消费级GPU(如RTX 4090)即可。
  • 全尺寸(671B MoE):需多卡服务器,但激活参数少,推理高效。
  1. 优势:完全离线、私密、无限使用。

5. 使用技巧与最佳实践

  • 激发推理能力
  • 对R1模型:直接提问复杂问题,它会自动“内部思考”。
  • 提示示例:”请逐步推理,解释答案。”
  • 常见场景
  • 数学/代码:优先R1。
  • 日常/创作:V3.2更快。
  • 代理构建:V3.2支持工具调用。
  • 注意事项
  • 如所有LLM,可能有幻觉:验证重要输出。
  • API限速:付费提升额度。
  • 社区资源:Hugging Face、GitHub搜索“DeepSeek”获取fine-tune版本。

总结与展望

DeepSeek以开源和高性价比颠覆了LLM格局,让前沿AI触手可及。从网页聊天到API集成,再到本地部署,你现在就能上手!它特别适合学生、开发者探索推理模型。

实践建议:立即去chat.deepseek.com试试一个数学难题,感受其强大。

下一讲,我们将探讨Transformer的核心机制与注意力计算。欢迎分享你的DeepSeek使用经验!

文章已创建 3707

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

相关文章

开始在上面输入您的搜索词,然后按回车进行搜索。按ESC取消。

返回顶部