AI 提示词工程指南(2025)
系统学习提示词工程,附 10 个万能框架。
# AI 提示词工程指南:让 AI 听你的话
一个平庸的 AI 回答和一个出色的 AI 回答之间的差距,不在于模型——而在于提示词。提示词工程(Prompt Engineering)是与 AI 系统沟通的艺术和科学,目标是持续、可靠地获得你真正需要的输出。
无论你使用 ChatGPT 写作、Claude 分析、Midjourney 绘图,还是任何其他 AI 工具,提示词工程的原理都是相通的。本指南将教你系统化的技术方法,帮你从 AI 普通用户进阶为高级玩家。
---
目录
- [什么是提示词工程?](#什么是提示词工程)
- [为什么提示词工程如此重要](#为什么提示词工程如此重要)
- [核心原则](#核心原则)
- [关键技巧](#关键技巧)
- [10 个万能提示词框架](#10-个万能提示词框架)
- [不同平台的专用技巧](#不同平台的专用技巧)
- [常见错误与修正方法](#常见错误与修正方法)
- [构建你的提示词库](#构建你的提示词库)
- [提示词工程的未来](#提示词工程的未来)
- [常见问题](#常见问题)
---
什么是提示词工程?
提示词工程是设计和优化 AI 系统输入(提示词)以获取最优输出的实践。它涵盖:
- 指令设计:编写清晰、精确的指示
- 上下文管理:提供恰当的背景信息
- 输出格式化:明确指定结果的结构
- 迭代优化:基于结果系统性地改进提示词
- 系统设计:创建可复用的提示词模板和工作流
打个比方:如果 AI 模型是一位技能高超的专业人士,那么提示词工程就是撰写完美工作简报的艺术。简报模糊,工作就模糊;简报精确,成果就精确。
---
为什么提示词工程如此重要
10 倍效果差异
同一个 AI 模型,因提示词不同,可以产出天差地别的结果:
普通提示词:
写一篇关于气候变化的文章。
结果:泛泛而谈的通用文章,毫无特色。
工程化提示词:
你是一位环境科学家,正在为商业受众撰文。请解释未来十年内气候变化
对沿海城市商业地产构成的前 3 大财务风险。包含具体数据点,说明
估算背后的方法论,并以 3 条可执行的风险缓解策略结尾。
格式:专业备忘录,包含执行摘要。
结果:聚焦、数据丰富、可执行的分析报告,精准匹配目标受众和用途。
职业价值
提示词工程正在成为公认的职业技能:
- 专属岗位:AI 公司的"提示词工程师"职位(年薪 $100K-300K+)
- 效率倍增器:所有 AI 工具的产出质量提升 3-10 倍
- 竞争优势:更好的提示词 = 更好的 AI 输出 = 更好的工作成果
- 面向未来:AI 普及的时代,提示词素养将成为基本能力
---
核心原则
1. 具体化,不要模糊
最基本的原则。提示词中的每个字都应该传递信息。
❌ 模糊:
帮我做个演示。
✅ 具体:
为我们的 Q4 产品发布会制作一个 10 页 PPT 大纲。
听众:C 级高管。
内容包括:核心指标、市场定位、竞品分析、上市时间表。
语气:自信、数据驱动。
2. 提供上下文
AI 模型对你的情况一无所知,除非你主动告诉它:
背景:我是一家金融科技领域的 A 轮创业公司创始人。公司有 50 名员工,
年经常性收入 500 万美元,计划 6 个月后进行 B 轮融资。
任务:撰写一封董事会更新邮件,涵盖 Q3 业绩表现、主要挑战和 Q4
战略重点。
3. 定义输出格式
永远不要假设 AI 知道你想要什么格式:
请按以下格式输出:
- 执行摘要(最多 3 句话)
- 详细分析(项目符号列表)
- 建议方案(带优先级的编号列表)
- 下一步行动(含负责人和截止日期的行动项)
4. 设置约束条件
边界让输出更聚焦,避免漫无目的:
约束条件:
- 最多 500 字
- 只使用公开可查的数据
- 不使用行话——解释所有专业术语
- 至少包含 3 个具体案例
- 以明确的行动号召结尾
5. 迭代,不要将就
你的第一版提示词只是草稿。根据输出不断优化:
- 写初始提示词 → 审查输出
- 找出缺失或错误之处
- 添加说明、示例或约束
- 重新生成 → 再次审查
- 重复直到满意
---
关键技巧
1. 角色设定(Role Assignment)
是什么: 给 AI 分配一个具体的身份、专业领域或视角。
为什么有效: 它能激活特定领域的知识,并调整回答的语气、词汇和深度。
模式:
你是一位 [角色],拥有 [年数] 年 [领域] 经验。
你的专长是 [具体方向]。你的沟通风格是 [风格]。
示例:
你是一位专精国际企业税法的资深税务律师。请解释一家美国科技公司
在爱尔兰设立子公司的税务影响。
你是一位米其林星级主厨,专长农场直供料理。请使用 1 月份太平洋
西北地区可获得的食材,设计一套 5 道菜的品鉴菜单。
你是一位 YC 合伙人,正在评审创业路演。请点评这份商业计划:[细节]。
请直接、具体地说明哪些有效、哪些无效、缺少什么。
高级技巧——组合角色:
你同时是一位软件工程师和 UX 研究员。请从技术可行性和用户体验
两个角度,审查这个功能提案。
2. 分步思考 / 思维链(Chain of Thought)
是什么: 指示 AI 按步骤顺序思考问题,而不是直接跳到结论。
为什么有效: 复杂问题需要中间推理步骤。CoT 提示能减少错误,产生更可靠的答案。
模式:
请一步一步思考这个问题:
- 首先,[识别/分析/考虑]……
- 然后,[评估/比较/计算]……
- 最后,[得出结论/推荐/综合]……
展示每一步的推理过程。
示例:
分析我们公司是否应该进入日本市场。请一步步思考:
- 首先,评估市场机会(规模、增长率、竞争格局)
- 然后,评估进入壁垒(监管、文化、运营)
- 接着,估算所需投资和时间表
- 然后,分析潜在风险和缓解策略
- 最后,给出附带置信度的推荐
展示每一步的推理过程。
变体写法:
- "让我们一步步来思考这个问题。"
- "请展示你的推理过程。"
- "将这个问题拆分为子问题,逐一解决。"
3. 少样本提示(Few-Shot Prompting)
是什么: 在提出实际任务之前,提供所需输入-输出模式的示例。
为什么有效: 示例是传达格式、风格和质量期望的最高效方式。
模式:
以下是 [任务] 的示例:
输入:[示例 1 输入]
输出:[示例 1 输出]
输入:[示例 2 输入]
输出:[示例 2 输出]
现在对以下内容做同样的处理:
输入:[实际任务]
输出:
示例:
将技术功能描述转换为面向用户的价值主张:
功能:"所有静态和传输中的数据均采用 256 位 AES 加密"
价值:"你的数据受到与银行和政府相同标准的安全保护——无论存储还是传输,都万无一失。"
功能:"99.99% 可用性 SLA,支持自动故障转移"
价值:"你需要的工具始终在线。我们的系统在你察觉之前就已自动恢复。"
功能:"所有设备间的实时双向同步"
价值:
何时使用 Few-Shot:
- 复杂的格式要求
- 特定的语气或风格匹配
- 分类或归类任务
- 当 AI 对你的零样本提示理解有误时
4. 带验证的思维链(CoT with Verification)
是什么: 让 AI 推理出答案后,自行验证结果。
模式:
解决这个问题。请一步步展示你的过程。
得出答案后,通过以下方式验证:
- 检查你的数学/逻辑
- 判断答案是否符合直觉
- 尝试另一种方法来确认
如果发现错误,请在给出最终答案前修正。
5. 自洽性检查(多路径推理)
是什么: 让 AI 用多种方法解决同一个问题,然后比较结果。
模式:
请从三个不同角度分析这个问题:
方法 1:[方法论 A]
方法 2:[方法论 B]
方法 3:[方法论 C]
比较结果。哪些地方一致?哪些地方有分歧?
基于共识,给出你的最终建议。
6. 结构化输入/输出
是什么: 对输入和请求的输出都使用明确的格式。
模式:
输入格式:
- 公司:[名称]
- 行业:[领域]
- 挑战:[描述]
- 预算:[金额]
- 时间表:[时间范围]
输出格式:
分析
[2-3 段评估]
方案选项
方案 成本 时间 风险 影响
推荐
[1 段话,包含明确的行动项]
7. 角色 + 受众校准
是什么: 同时定义 AI 的身份和它的写作对象。
模式:
写作者:你是一位 [具备特定专业知识的角色]
受众:[描述读者——知识水平、需求、背景]
目标:[读者在阅读后应该怎么想、怎么感受、怎么做]
示例:
写作者:你是一位擅长用简单语言解释复杂概念的网络安全专家。
受众:没有技术背景的小企业主,在听说近期的勒索软件攻击后感到担忧。
目标:让他们理解本周就能采取的 3 项预防措施,且不需要雇用 IT 顾问。
8. 否定提示(指明不要什么)
是什么: 明确说明输出中不应出现的内容。
模式:
重要:请勿包含:
- 泛泛的套话("在当今快节奏的世界中……")
- 不必要的模棱两可的表述
- 需要专业工具才能实施的建议
- 超过 5000 元预算的推荐方案
9. 元提示(让 AI 帮你写提示词)
是什么: 用 AI 来帮助设计更好的提示词。
模式:
我想用 AI 来 [目标]。请帮我编写最优的提示词:
- 先向我提 5 个澄清问题来了解我的需求
- 根据我的回答,起草 3 个提示词版本
- 解释每个版本的优势
- 推荐最佳版本并说明原因
10. 递归优化
是什么: 将 AI 的输出作为下一轮迭代的输入。
模式:
第 1 步:"生成 [内容] 的初稿"
第 2 步:"现在审视这份初稿。哪些地方薄弱?缺少什么?"
第 3 步:"结合你的审视意见重写"
第 4 步:"给新版本打 1-10 分,并建议最后的改进"
第 5 步:"应用这些改进,输出最终版本"
---
10 个万能提示词框架
这些框架适用于 ChatGPT、Claude、Gemini、通义千问、文心一言等各类语言模型。
1. RACE 框架(角色、行动、背景、期望)
角色(Role):你是一位 [具备专业知识的具体角色]
行动(Action):[要执行的具体任务]
背景(Context):[背景信息和约束条件]
期望(Expectation):[期望的输出格式和质量标准]
示例:
角色:你是一家 SaaS 公司的资深产品经理。
行动:为新的用户引导流程编写产品需求文档(PRD)。
背景:我们目前的引导流程有 40% 的流失率。我们是一款 B2B 项目
管理工具。用户需要创建项目、邀请团队成员并完成第一个任务。
期望:包含用户故事、验收标准、线框图描述、成功指标和边缘情况。
格式为专业 PRD 文档。
2. CREATE 框架(角色、请求、示例、调整、类型、附加)
角色(Character):[AI 应该扮演谁?]
请求(Request):[你需要什么?]
示例(Examples):[展示好的输出长什么样]
调整(Adjustments):[特定的修改或约束]
类型(Type):[输出格式]
附加(Extras):[额外要求]
3. COSTAR 框架(背景、目标、风格、语气、受众、响应)
背景(Context):[背景情况]
目标(Objective):[你想实现什么]
风格(Style):[写作风格——学术、轻松、技术]
语气(Tone):[情感基调——自信、共情、紧迫]
受众(Audience):[谁会阅读]
响应(Response):[格式说明]
示例:
背景:我们的 SaaS 产品刚经历了 2 小时的宕机,影响了 15% 的用户,
且发生在工作时间。
目标:为受影响的客户撰写事后沟通邮件。
风格:专业但有人情味——不要过度企业化。
语气:道歉、透明、令人安心。
受众:依赖我们 API 的 CTO 和工程经理。
响应:邮件格式,包含主题行、正文(300 字以内)和附带时间线的
技术附录。
4. 访谈框架
我想要 [达成目标]。在给出回答之前,请通过逐个提问的方式
采访我,收集你需要的信息。最多问 [N] 个问题,然后根据
我的回答给出你的建议。
5. 专家小组框架
从三位专家的视角分析 [主题/决策]:
专家 1:[角色 A] —— 关注 [方面 1]
专家 2:[角色 B] —— 关注 [方面 2]
专家 3:[角色 C] —— 关注 [方面 3]
每位专家分析完后,让他们就关键分歧点进行辩论。
然后给出一个综合的平衡建议。
示例:
分析我们是否应该从单体架构迁移到微服务:
专家 1:资深后端架构师 —— 关注技术复杂性
专家 2:工程副总裁 —— 关注团队生产力和招聘
专家 3:CFO —— 关注成本、时间线和投资回报
每位专家分析后进行辩论。然后综合给出建议。
6. 模板填充框架
根据我提供的信息,填写以下模板:
---
[部分 1:标题]
[此处应填写的内容说明]
[部分 2:标题]
[此处应填写的内容说明]
[部分 3:标题]
[此处应填写的内容说明]
---
我的信息:
[提供你的原始信息]
7. 约束收紧框架
生成 [内容类型],遵循以下约束:
必须包含:[必要元素]
不得包含:[排除元素]
长度:[精确规格]
格式:[结构要求]
语气:[具体语气]
受众知识水平:[入门/中级/专家]
成功标准:[如何判断输出是否合格]
8. 苏格拉底框架
通过苏格拉底式对话帮我理解 [主题]。
首先问我对此已经了解多少。根据我的回答,提出深入的问题来
揭示我理解中的空白。引导我自己发现关键洞察,而不是直接
告诉我答案。
经过 5-7 轮交流后,总结我们揭示的内容,并指出任何仍然
存在的误解。
9. 前后对比框架
以下是 [内容] 的 BEFORE(改前)版本:
[粘贴原文]
我希望通过修改实现:
- [改进 1]
- [改进 2]
- [改进 3]
请创建 AFTER(改后)版本,然后解释你做了哪些关键改动以及
每项改动为什么能提升原文。
10. 脚手架框架(适用于复杂任务)
我需要 [复杂目标]。让我们分阶段进行:
阶段 1:规划
- 帮我定义范围和要求
- 识别潜在挑战
阶段 2:调研
- 我需要哪些信息?
- 最佳实践是什么?
阶段 3:执行
- 逐步实施指南
- 质量检查点
阶段 4:审查
- 如何评估结果
- 改进机会
从阶段 1 开始。我确认后再进入下一阶段。
---
不同平台的专用技巧
ChatGPT(GPT-4o / GPT-4)
- 自定义指令:使用"自定义指令"功能设置持久化的上下文(你的角色、偏好的回复风格),避免每次重复。
- 记忆功能:为长期项目开启记忆。ChatGPT 会在不同对话间记住你的偏好。
- 多模态:直接上传图片、PDF 和数据文件。说"分析这个文档"或"这张图片里有什么?"
- 高级数据分析:对于数据工作,启用代码解释器。它可以执行 Python 代码、创建图表、处理文件。
- 自定义 GPTs:对于重复工作流,创建带有预配置指令和知识库的自定义 GPT。
Claude(Anthropic)
- 超长上下文:Claude 擅长处理超长文档(200K+ tokens)。用它分析完整代码库、合同或书稿。
- XML 标签:Claude 对 XML 结构化提示反应极好:
你正在审查一份软件许可交易的法律合同。
[粘贴完整合同]
识别对被许可方的前 5 大风险,用通俗语言解释每条,
并为每条建议具体的修改条款。
使用编号部分,标题为:风险、解释、建议修改。
- 深度思考:Claude 自然地支持逐步思考。它在细致分析和避免有害输出方面特别出色。
- Artifacts:使用 Claude 的 artifact 功能处理代码、文档等可迭代的独立内容。
Midjourney
- 提示词结构:`[主体], [细节], [风格], [光线], [参数]`
- 权重系统:用 `::` 实现多重提示:`cat::2 astronaut::1`
- 否定提示:用 `--no` 代替"没有"或"不要"
- 风格参考:用 `--sref [URL]` 保持多次生成的风格一致性
- 角色参考:用 `--cref [URL]` 保持角色一致性
国产 AI 工具
本指南的所有技巧对国产 AI 同样有效:
- 通义千问(Qwen):对结构化提示响应良好,支持长上下文
- 文心一言(ERNIE Bot):中文理解优秀,适合中文内容创作
- Kimi:长文本处理突出,适合文档分析
- 豆包:日常使用方便,对话体验流畅
- 讯飞星火:多模态能力强,语音交互优秀
跨平台通用技巧:
- 在不同模型上测试相同的提示词,找到最适合你任务的模型
- 将好用的提示词保存到个人库中,按任务类型分类
- 给提示词做版本管理——小修改可能带来巨大的输出差异
- 注意温度参数:事实性任务用低温度(0.1-0.3),创意任务用高温度(0.7-1.0)
---
常见错误与修正方法
错误 1:信息过载
❌ 一次塞太多:
写一篇关于 AI 的 5000 字全面博客文章,涵盖历史、当前应用、
未来预测、伦理问题、技术架构、商业影响、教育影响、医疗应用、
环境考量和监管框架。每个章节都要包含案例、数据、引言和可执行建议。
✅ 分步进行:
我们一起写一篇关于 AI 在医疗领域应用的博客文章。
先给出 8-10 个章节的大纲。我确认后,我们再逐章撰写。
错误 2:指令模糊
❌ 模糊:
把这个改好一点。
✅ 具体:
请改进这封邮件:
- 开头更吸引人(用一个问题或出人意料的数据)
- 每段缩短到 2-3 句话
- 结尾添加明确的行动号召
- 保持专业但友好的语气
错误 3:没有质量标准
❌ 没有标准:
写一段产品描述。
✅ 有标准:
写一段产品描述:
- 以核心价值而非功能开头
- 150-200 字
- 使用感官化语言
- 针对目标买家的主要痛点(时间管理)
- 以社会证明结尾(提及"10,000+ 用户")
- 衡量标准:转化率优化专家会给这段描述打 8 分以上吗?
错误 4:忽视对话历史
不要在每条消息中重复完整的上下文。利用对话构建:
消息 1:[完整背景 + 初始请求]
消息 2:"很好,现在展开第 3 节,增加更多技术细节"
消息 3:"在第 3 节添加一个对比表格"
消息 4:"完美。现在我们进入第 4 节。"
错误 5:没有发挥 AI 的长处
每个模型都有强项,要善加利用:
- ChatGPT:擅长对话、创意写作、代码生成
- Claude:擅长长文档分析、细致推理、安全性
- Gemini:多模态任务强、Google 生态集成好
- Midjourney:艺术化、风格化图片最佳
- 通义千问:中英双语能力均衡,API 友好
---
构建你的提示词库
组织体系
创建按类别组织的个人提示词库:
📁 提示词库
├── 📁 写作
│ ├── 博客文章模板.md
│ ├── 邮件模板.md
│ └── 社交媒体.md
├── 📁 编程
│ ├── 代码审查.md
│ ├── 调试模板.md
│ └── 文档编写.md
├── 📁 分析
│ ├── 数据分析.md
│ ├── 市场调研.md
│ └── 竞品分析.md
├── 📁 创意
│ ├── Midjourney 模板.md
│ ├── 头脑风暴.md
│ └── 命名生成器.md
└── 📁 商业
├── 战略规划.md
├── 招聘.md
└── 投资人更新.md
模板格式
每个保存的提示词都应记录:
## [提示词名称]
用途: 这个提示词是做什么的
最佳模型: 哪个 AI 模型效果最好
温度设置: 推荐的温度值
提示词正文:
[实际提示词文本]
变量:
- [变量1]:说明
- [变量2]:说明
输出示例:
[好的输出长什么样]
备注:
- 效果好的地方
- 已知局限性
- 有效的变体
持续改进
- 定期测试:模型频繁更新——每月重新测试你最好的提示词
- A/B 测试:尝试变体,保留胜出的版本
- 分享学习:和同事交换提示词
- 记录失败:理解提示词失败的原因和理解成功的原因同样有价值
---
提示词工程的未来
当前状态
2025 年的提示词工程正处于拐点:
- 模型越来越善于理解模糊指令
- 多模态提示(文本 + 图片 + 音频)正在成为标配
- 系统提示和自定义指令减少了重复提示的需要
- 专用模型在窄领域降低了对复杂提示词工程的需求
未来趋势
- Agent 工作流:提示词将越来越多地编排多步骤 AI Agent 工作流,而非单次补全
- 提示词编译器:将自然语言提示词优化为模型特定格式的工具
- 自适应提示:随时间学习你偏好提示风格的 AI 系统
- 可视化提示词构建器:用于构建复杂提示词流水线的无代码工具
持久的技能
即使模型不断进步,清晰、结构化沟通的核心技能仍然有价值。那些能最好地表达自己想要什么的人——能系统性地思考问题并精确表达需求的人——无论技术如何演变,都将始终从 AI 中获得更好的结果。
---
常见问题
1. 提示词工程在所有 AI 模型上都通用吗?
核心原则——具体化、提供上下文、结构化输出、迭代优化——是通用的。但每个模型有自己的特点。ChatGPT 对对话式提示响应好,Claude 擅长 XML 结构化提示和超长上下文,Midjourney 需要完全不同的视觉描述风格。先从通用原则入手,再针对具体模型优化。
2. 提示词应该多长?
需要多长就多长,但不要冗余。简单任务可能只需一句话。复杂任务可能需要几段上下文、约束和示例。关键是每个字都应该增加价值。删除诸如"请你帮我""我希望你能"之类的填充词——它们消耗 token 但不增加信息。
3. 提示词工程是一个真正的职业吗?
是的。虽然"提示词工程师"的头衔可能会演变,但其底层技能——有效地与 AI 系统沟通以产出可靠、高质量输出的能力——正变得越来越受重视。它对产品经理、内容创作者、开发者、数据分析师以及任何经常使用 AI 工具的人都很相关。与其说它是一个独立职业,不如说它是任何 AI 增强型岗位中的关键技能。
4. 我应该用 ChatGPT、Claude 还是其他工具?
取决于任务。ChatGPT(GPT-4o)是最好的全能选手,多模态能力强。Claude 在长文档分析、细致推理和需要谨慎安全考量的任务上出色。Gemini 与 Google 生态集成好。图像生成方面,Midjourney 最艺术化,DALL·E 更忠实于指令。国内用户可优先考虑通义千问、Kimi 等工具。许多高级用户针对不同任务使用不同模型。
5. 随着 AI 变得更智能,提示词工程会过时吗?
部分会。随着模型进步,简单提示就能获得更好的结果。但复杂、高风险和创意性应用始终受益于专业的提示词技巧。就像摄影:今天每个人都能用手机拍出不错的照片,但专业摄影师仍然存在,因为构图、光线和创意视角始终重要。同样,提示词工程将从一种必需品演变为一门手艺。
---
总结
提示词工程是你今天能学到的最容易上手的 AI 技能。它不需要编程、不需要特殊工具、不需要技术背景——只需要你愿意清晰地思考自己想要什么,并精确地表达出来。
从核心原则开始:具体化、提供上下文、定义输出格式、持续迭代。然后在处理更复杂的任务时,逐步叠加角色设定、思维链、少样本学习等高级技巧。
本指南中的 10 个框架为你提供了应对几乎任何场景的工具箱。保存与你产生共鸣的框架,根据你的工作流定制它们,并随着时间推移构建你的个人提示词库。
AI 革命不仅仅是拥有强大模型的访问权——更在于知道如何使用它们。而这,始于你的下一条提示词。
下一步行动:
- 从本指南中选 3 个框架,今天就试用
- 创建你的第一个提示词库文件夹
- 用不同的提示技巧测试同一个任务,比较效果
- 把一个提示词分享给同事,看看他们如何改进
- 收藏本指南,在面对新的 AI 挑战时随时查阅
掌握提示词,掌握 AI。🎯