使用DeepSeek R1的19条经验

发布时间:2025-03-06 15:55

  DeepSeek R1 使用总览


· 核心:理解模型特点,掌握沟通技巧,避免无效策略

· 目标:更有效地利用 R1 完成任务


·  五大语言模型的特点


· Token

o 模型在训练时会将内容进行 Token 化。

o 大模型所看到和理解的世界与人类不同。

o 所有训练数据(书籍、网页、对话记录等)会被切割成 Token 的基本单元,类似于文字碎片。

o Token 会被转化为数字编码,类似于模型能理解的密码本。

o 局限性:不擅长处理数单词中的字母数量或精确字数的要求。

· 知识截止时间

o DeepSeek R1 的基础模型训练数据有时间窗口,会在发布前关闭。

o 三重时间壁垒

§ 预训练阶段处理 PB 级别原始数据,数据清洗耗时。

§ 训练后需要经过监督微调、强化学习以及基于人类反馈的强化学习。

o 知识滞后性

§ 模型训练完成后出现的新事物无法自动识别和理解。

§ 对训练后发生的重大事件不太了解。

o 突破知识限制的方法

§ 激活联网搜索功能,让 R1 自主搜索信息。

§ 自主补充必要知识,例如上传文档或在提示词中补充信息。

· 缺乏自我认知

o 多数模型不知道自己叫什么或是什么模型。

o 问题

§ AI有时会给出错误的自我认知,例如认为自己是 ChatGPT

§ 无法让 R1 告诉你它自己有什么特点或使用技巧。

· 记忆限制

o 模型有上下文长度限制,DeepSeek R1 目前提供 64K Token 的上下文长度。

o 问题

§ 无法一次投喂太长的文档。

§ 对话轮次过多时,可能遗忘最初的聊天内容。

· 输出长度限制

o 多数模型会将输出长度控制在 4K 8K,即单次对话最多回答 2000-4000 个中文字符。

o 问题

§ 无法一次性完成长文翻译或写作。

o 解决方法

§ 长文翻译:多次复制或通过代码调用 API 多次执行。

§ 长文写作:先让 R1 梳理框架列出提纲目录,再根据目录生成不同阶段的内容。


·  七项与 R1 对话的技巧


· 提出明确的要求

o 清楚表达需要 AI 帮你做什么,做到什么程度,避免让 AI 猜测。

o 示例

§ 复制英文文本时,明确告知需要翻译、总结还是出题。

§ 想写一篇 500 字的文章,明确表达文章主题和字数要求。

· 要求特定的风格

o R1 在特定风格写作方面表现出色。

o 示例

§ 用李白的风格写诗。

§ 按贴吧暴躁老哥的风格骂人。

§ 用鲁迅的文风进行讽刺。

§ 模仿任意作家风格进行写作。

§ 按脱口秀演员风格创作脱口秀脚本。

o 有效表达方式

§  R1 说人话,或让 R1 认为你是初中生,简化解释复杂概念。

· 提供充分的任务背景信息

o 告诉 R1 你为什么要做这件事,面临的现实背景或问题是什么,让 R1 将其纳入思考。

o 示例

§ 生成减肥计划时,告知身体状况、饮食摄入和运动情况。

· 主动标注自己的知识状态

o 清晰的知识坐标能让 AI 输出更精确地匹配你的理解层次的内容。

o 示例

§ 告诉 R1 我是初中生或小学生,把自己放置在知识背景约等于 0 的知识状态。

§ 希望深入探讨某些内容时,清晰表达你在该领域的知识状态或是否存在关联领域的知识。

· 定义目标而非过程

o 提供清晰的目标,让 R1 具有一定的思考空间,更好地执行任务。

o 像产品经理提需求那样描述你想要什么,而不是像程序员写代码那样规定怎么做。

o 示例

§ 产品评审会后整理录音文字稿,可以进一步思考总结出的材料要如何使用,为 R1 提供目标,让它创造性地完成任务。

· 提供 AI 不具备的知识背景

o 当任务涉及到模型训练截止后的新信息时,需要帮助 R1 拼上缺失的拼图。

o 通过结构化的输入帮助 AI 突破知识限制,避免因信息缺乏而出现错误回答。

· 从开放到收敛

o R1 的思维链是透明展开的,从 R1 思考的过程中能收获很多信息。

o R1 在展开思考时会进行可能性预测,补充完善信息可以避免 R1 猜测,从而提供更精确的结果。

o 示例

§ R1 在思考涨价方案时,提供分阶段涨价、增加产品价值、通过营销活动转移注意力三种方案,并预测可能具有保持市场份额或提升品牌形象的需求。可以借此思考倾向的方法和目标,进一步收敛提示词。


·  七种被验证为无效的提示策略


· 思维链提示

o R1 经过强化学习后已经能产生更好的思维链,无需手动提供。

· 结构化提示词

o 依然可以用 Markdown 格式的语句使信息结构更清晰,但必要性不强。

· 扮演专家角色

o R1 本身就是一个专家模型,会尝试专家思维,无需额外指定。

   ·  完成任务后给奖励

       o无效,甚至会被 AI 认为是笑话。

   ·  少示例提示 (Few-shot)

       o应该规避。

       oDeepSeek 团队在发布 R1 技术报告时也明确提到应规避此技巧。

   ·  角色扮演

       oR1 不太擅长情感化的角色扮演。

       o情感化的对话依赖直觉,而 R1 每次都要进行深思熟虑。

   ·  对已知的概念进行解释

       oR1 非常理解知名作家和人物的风格,且思考时会进行更深入和更丰富的结构。



原文转载自求知笔记


扫一扫在手机上查看当前页面

打印本页 关闭本页