提示工程:与AI对话的基础
“知道想要什么,并且能描述出来。” 这是写《AI时代最重要的四个能力》时,给第一个能力起的名字:懂诉求。 描述出来——到底怎么描述? 这件事有个名字,叫提示工程。不神秘。不需要会写代码。就是把心里模糊的想法,翻译成AI能懂的句子。反复翻译,反复调,直到AI给的东西对得上心里那个模糊的形状。 基础认知 编写提示不需要数据科学或机器学习背景——人人都可以做到。但写好提示并不简单,它涉及模型选择、训练数据、配置参数、措辞、语气、结构和上下文等多个变量,需要持续学习和实践。 LLM的本质 LLM 的本质是预测引擎。它接收一段连续文本作为输入,基于训练数据预测下一个最可能的 token,然后将预测结果追加到文本末尾,如此循环往复,逐步生成完整输出。 提示工程的定义 提示工程是设计高质量提示以引导 LLM 生成准确输出的过程。它适用于文本摘要、信息提取、问答、分类、翻译、代码生成等多种任务,需要针对具体模型优化提示并调整各项输出配置。 迭代过程 提示工程是一个迭代过程。模型选择、配置参数、措辞等多个变量都会影响效果,一次写出完美提示几乎不可能,需要反复尝试和调整才能获得满意的结果。 输出配置 输出长度(Token Limit) 输出长度控制模型生成的最大 token 数量。减少该值不会让输出更简洁,只是到上限即停止预测。短输出需求仍需在提示中明确要求简洁。 采样控制 Temperature(随机性) Temperature 控制模型输出的随机程度。低值(接近 0)输出更确定、保守;高值(接近 1)输出更有创造性、多样。数学或事实类任务建议设为 0。 Top-K(词频筛选) Top-K 限定模型仅从概率最高的 K 个 token 中选取下一个词。K 值越小,可选范围越窄,输出越保守和确定;K 值越大,候选池越宽,输出越多样和不可预测。 Top-P(累积概率筛选) Top-P 限定模型仅从累计概率达到 P 的最小 token 集合中采样,候选数量随概率分布动态调整。设 Top-P 为 0 则退化为仅选最可能 token(Temperature 和 Top-K 失效);设为 1 则不排除任何 token。 综合应用 通用起点:temperature=0.2,top-P=0.95,top-K=30(连贯、有适度创造性)。 需要创造性:temperature=0.9,top-P=0.99,top-K=40。 需要确定性:temperature=0.1,top-P=0.9,top-K=20。 唯一正确答案:temperature=0。 需注意:自由度过高会降低生成文本的相关性,设置不当还可能引发"重复循环错误"(模型陷入重复输出相同词语或句子的循环)。 基础提示 提示的基本结构 一个设计良好的提示通常由以下要素构成,写作时可将其作为自查清单: 任务指令:明确告诉模型要完成什么任务(分析、总结、分类、生成等) 上下文:提供任务所需的背景信息和约束条件 示例:通过少样本示例帮助模型理解期望的输出模式 输出格式:指定输出的结构(纯文本、列表、JSON、Markdown 表格等) 角色与语气:定义模型以什么身份、什么风格输出 并非每个提示都需要所有要素——简单任务可能只需一句指令,复杂任务则需要充分填充。关键在于根据任务复杂度有意识地组合这些要素。 ...