提示工程 | 饼哥

“知道想要什么，并且能描述出来。” 这是写《AI时代最重要的四个能力》时，给第一个能力起的名字：懂诉求。描述出来——到底怎么描述？这件事有个名字，叫提示工程。不神秘。不需要会写代码。就是把心里模糊的想法，翻译成AI能懂的句子。反复翻译，反复调，直到AI给的东西对得上心里那个模糊的形状。基础认知编写提示不需要数据科学或机器学习背景——人人都可以做到。但写好提示并不简单，它涉及模型选择、训练数据、配置参数、措辞、语气、结构和上下文等多个变量，需要持续学习和实践。 LLM的本质 LLM 的本质是预测引擎。它接收一段连续文本作为输入，基于训练数据预测下一个最可能的 token，然后将预测结果追加到文本末尾，如此循环往复，逐步生成完整输出。提示工程的定义提示工程是设计高质量提示以引导 LLM 生成准确输出的过程。它适用于文本摘要、信息提取、问答、分类、翻译、代码生成等多种任务，需要针对具体模型优化提示并调整各项输出配置。迭代过程提示工程是一个迭代过程。模型选择、配置参数、措辞等多个变量都会影响效果，一次写出完美提示几乎不可能，需要反复尝试和调整才能获得满意的结果。输出配置输出长度（Token Limit）输出长度控制模型生成的最大 token 数量。减少该值不会让输出更简洁，只是到上限即停止预测。短输出需求仍需在提示中明确要求简洁。采样控制 Temperature（随机性） Temperature 控制模型输出的随机程度。低值（接近 0）输出更确定、保守；高值（接近 1）输出更有创造性、多样。数学或事实类任务建议设为 0。 Top-K（词频筛选） Top-K 限定模型仅从概率最高的 K 个 token 中选取下一个词。K 值越小，可选范围越窄，输出越保守和确定；K 值越大，候选池越宽，输出越多样和不可预测。 Top-P（累积概率筛选） Top-P 限定模型仅从累计概率达到 P 的最小 token 集合中采样，候选数量随概率分布动态调整。设 Top-P 为 0 则退化为仅选最可能 token（Temperature 和 Top-K 失效）；设为 1 则不排除任何 token。综合应用通用起点：temperature=0.2，top-P=0.95，top-K=30（连贯、有适度创造性）。需要创造性：temperature=0.9，top-P=0.99，top-K=40。需要确定性：temperature=0.1，top-P=0.9，top-K=20。唯一正确答案：temperature=0。需注意：自由度过高会降低生成文本的相关性，设置不当还可能引发"重复循环错误"（模型陷入重复输出相同词语或句子的循环）。基础提示提示的基本结构一个设计良好的提示通常由以下要素构成，写作时可将其作为自查清单：任务指令：明确告诉模型要完成什么任务（分析、总结、分类、生成等）上下文：提供任务所需的背景信息和约束条件示例：通过少样本示例帮助模型理解期望的输出模式输出格式：指定输出的结构（纯文本、列表、JSON、Markdown 表格等）角色与语气：定义模型以什么身份、什么风格输出并非每个提示都需要所有要素——简单任务可能只需一句指令，复杂任务则需要充分填充。关键在于根据任务复杂度有意识地组合这些要素。 ...