本心、输入输出、结果
文章目录
- 加州大学提出 PromptAgent 帮忙我们高效的使用 ChatGPT
- 前言
- 加州大学团队提出了可以自动优化 Prompt 的框架 —— PromptAgent
- PromptAgent 原理
- 论文
- 实例介绍
- PromptAgent 框架设计
- PromptAgent 的策略优化过过程
- PromptAgent 的结果是否具备普适性
- 弘扬爱国精神
加州大学提出 PromptAgent 帮忙我们高效的使用 ChatGPT
编辑:简简单单 Online zuozuo
地址:https://blog.csdn.net/qq_15071263
如果觉得本文对你有帮助,欢迎点赞、收藏、评论
前言
要把大模型用好,必须得研究一下 Prompt 使用技巧,但有时候绞尽脑汁想的 Prompt 却无法获得期望的结果
所以,一个好的 Prompt 的重要性不言而喻,好的 Prompt 工程师新兴职业已经年薪达到了 30 万美元
加州大学团队提出了可以自动优化 Prompt 的框架 —— PromptAgent
PromptAgent 原理
通过结合大模型的自我反思特点与蒙特卡洛树搜索规划算法,自动迭代检查 Prompt ,发现不足,并根据反馈对其进行改进,寻找通往最优 Prompt 的路径
论文
论文下载地址
实例介绍
假设我们想要实现生物医学领域的命名实体识别任务,从句子中提取疾病等实体
Prompt :从句子中提取疾病或状况
使用 PromptAgent 进行优化
您的任务是提取疾病或疾病情况...请避免包含任何相关元素,如遗传模式(如常染色体显性)、基因或基因座(如PAH)、蛋白质或生物途径。...考虑具体的疾病和更广泛的类别,并记住疾病和情况也可以以常见的缩写或变体形式出现。以以下格式提供识别出的疾病或情况:{entity_1,entity_2,....}。...请注意,“locus”一词应被识别为基因组位置,而不是疾病名称。
PromptAgent 框架设计
PromptAgent 搜索策略使用的是著名的蒙特卡洛树搜索。整体框架如图
步骤说明
1、给定当前状态(也就是初始prompt),基本模型(gpt-3.5-turbo)从任务数据集获得初始输出,初始输出往往不如人意,需要进一步优化。
2、使用优化器模型(gpt-4)提供错误反馈并给出改进建议。
3、优化后的模型根据反馈更新prompt并过渡到下一个状态。
然后循环进行多次
PromptAgent 的策略优化过过程
蒙特卡洛树搜索(MCTS)通过逐步构建树状结构来实现策略搜索,其中每个节点表示一个状态,每条边表示状态转移的动作。MCTS执行选择、扩展、模拟和反向传播四步走来迭代搜索。迭代过程在达到预定义的迭代次数后结束,选择最高回报的路径作为最终的 Prompt
步骤
- 选择
- 扩展
- 模拟
- 反向传播
PromptAgent 使用预设的迭代次数执行上述四个操作,当达到迭代次数后,选择具有最高回报的最佳路径中的最佳节点(即 Prompt )进行最终评估
PromptAgent 的结果是否具备普适性
PromptAgent 输出的专家级 Prompt 优化,在性能低于 GPT3.5 的模型上,会导致显著的性能下降,作用是负面的,但是在性能高于 GPT3.5 的模型上执行时,可以获得更好的结果