使用 GitHub Copilot 进行 Prompt Engineering 的初学者指南(译)

文章目录

    • 什么是 GitHub Copilot ?
    • GitHub Copilot 可以自己编码吗?
    • GitHub Copilot 的底层是如何工作的?
    • 什么是 prompt engineering?
      • 这是 prompt engineering 的另一个例子
    • 使用 GitHub Copilot 进行 prompt engineering 的最佳实践
      • 提供高级上下文,然后提供更详细的说明
        • 以下是使用上述技术让 p5.js 建造房屋的示例:
      • 提供具体细节
      • 提供例子
        • 零样本学习
        • 单样本学习
        • 少样本学习
        • 不提供示例
        • 提供示例
    • 附加建议
      • 迭代你的提示
      • 在 IDE 中保持相关文件打开的选项卡
      • 给你的 AI 助手一个身份
      • 使用可预测模式
      • 对描述其用途的变量和函数使用一致的、特定的命名约束
        • 使用良好的编码实践
    • 超越你的编译器
    • 开始使用 GitHub Copilot 练习 prompt engineering
    • 让我们保持共同学习
    • 参考资料

当我开始使用 GitHub Copilot 和其他生成式的 AI tools。我感觉到沮丧,因为我没有收到预期的结果。人们是如何感觉这些工具如此成功的?为什么 AI 工具没有按照我的意愿行事?例如,我让 GitHub Copilot 为我去解决 LeetCode 问题。GitHub Copilot 图标会旋转一表示它正在思考,然后我会收到不一致的建议或跟没本没有建议。我很生气,但是事实证明——我错了!经过更多实验,我提升了跟 GitHub Copilot 的沟通方法,通过以注释和代码的的形式提供上下文、例子和清晰的指令。后来我才知道,这种做法叫做 prompt engineering。在这篇博文中,将讨论充分利用 GitHub Copilot 的重要技巧。

首先,让我们从不熟悉 GitHub Copilot 或 prompt engineering 的人的基础知识开始。

什么是 GitHub Copilot ?

GitHub Copilot 是一个 AI 结对开发工程师被 GitHub 开发并且 GitHub Copilot 由 OpenAI Codex 提供支持,OpenAI CodeX 是 OpenAI 创建生成式预训练语言模型。它根据注释和代码的上下文提供上下文话的代码建议。要使用它,可以在以下 IDEs 安装 Github Copilot 插件:

  • Visual Studio

  • Visual Studio Code

  • Neovim

  • JetBrains IDEs (IntelliJ, PyCharm, WebStorm, etc)

GitHub Copilot 可以自己编码吗?

在 GitHub,使用术语「AI 结对开发程序员」、「AI 助手」和 「Copilot」因为没有开发人员,这个工具就无法工作!事实上,人工智能系统只能执行开发人员编程执行的任务,它们不具备自由意志或独立决策的能力。在这种情况下,GitHub Copilot 利用代码中的上下文和编写的注释来立刻建议代码!借助 GitHub Copilot,可以将注释转换为代码、自动填充重复的代码并显示可选建议。

GitHub Copilot 的底层是如何工作的?

在底层,GitHub Copilot 从注释和代码中抽取上下文,生成逐行建议和整个函数。OpenAI CodeX 是一种机器学习模型,可以将自然语言转换为代码,为 GitHub Copilot 提供支持。

什么是 prompt engineering?

Prompt engineering 是给 AI 模型提供特定指令去产生想要结果的一种实践。提示是可以触发 AI 模型响应的一系列文本或一行代码。可以将这个概念比作收到论文提示。可能会收到一个提示,要求写一篇关于克服挑战的经历的文章,或者写一本经典书籍,例如《了不起的盖茨比》。因此,可以根据所学内容对提示做出响应。大型语言模型或 LLM 的表现与此类似。

这是 prompt engineering 的另一个例子

当学习编程时,我曾参加过一项活动,向机器人指示如何制作三明治。这是一项有趣儿愚蠢的活动,它教会我:

  • 计算机只能做你告诉他们做的事情

  • 你的指示需要非常具体

  • 它们更擅长一步一步接受订单

  • 算法只是一系列指令

例如,如果告诉机器人去制作三明治,我需要告诉它:

  1. 打开面包袋

  2. 从袋子中取出两片面包

  3. 将面包并排放在柜台上

  4. 用黄油刀将花生酱涂在一片面包上

  5. 等等

在这里插入图片描述

如果没有这些明确的指令,机器人可能会做一些愚蠢的事情,例如在两片面包上涂花生酱,或者它可能根本不做任何事情。机器人不知道三明治是什么,也不知道如何制作三明治。它只知道遵循指示。

与此类似,GitHub Copilot 需要清晰的分步说明来生成最有帮助的代码。

接下来,让我们讨论 prompt engineering 的最佳实践,以便向 GitHub Copilot 提供清晰的指令并生成想要的结果。

使用 GitHub Copilot 进行 prompt engineering 的最佳实践

提供高级上下文,然后提供更详细的说明

对我来说最好的技巧是在文件顶部的注释中提供高级上下文,然后以注释和代码的形式提供更详细的说明。

例如,如果构建一个待办事项的应用程序。在顶部,我会注释写到:「使用 Next.js 构建一个待办事项应用程序,允许用户添加、编辑和删除待办事项」。然后在下面几行中,将会编写一条注释来创建:

  • 待办事项组件列表,让 GitHub Copilot 在评论下方生成该组件。

  • 按钮组件,让 GitHub Copilot 在评论下方生成该组件。

  • 输入组件,让 GitHub Copilot 在评论下方生成该组件。

  • 添加函数,让 GitHub Copilot 在评论下方生成该函数。

  • 编辑函数,让 GitHub Copilot 在评论下方生成该函数。

  • 删除函数,让 GitHub Copilot 在评论下方生成该函数。

  • 等等

以下是使用上述技术让 p5.js 建造房屋的示例:

在下面的 GIF 中,在顶部写了一条注释,概括性描述了希望 p5.js 绘制的内容。我想画一座白色的房子,有棕色的屋顶、红色的门和红色的烟囱。然后,为房子的每个元素编写注释,然后让 GitHub Copilot 为每个元素生成代码。

在这里插入图片描述

提供具体细节

当你提供具体详细信息时,GitHub Copilot 将可以生成更准确的代码建议。例如如果你想要 GitHub Copilot 从 API 查询数据,需要告诉它你想要查询的数据类型、如何处理数据和希望访问的 API endpoint。

这是一个没有指定具体信息的注释,GitHub Copilot 不太可能生成有用的建议:

// Get data from API
function getData() {
    //code goes here
}

在上面的例子中,GitHub Copilot 除了函数名以及左右括号之外,没有产生任何内容。

这是一个指定具体信息的注释,GitHub Copilot 更有可能生成有用的建议:

// Pass in user ids and retrieve user data from jsonplaceholder.typicode.com API, then return it as a JSON object
async function getUserData(userId) {
    const response = await fetch(`https://jsonplaceholder.typicode.com/users/${userId}`);
    const data = await response.json();
    return data;
}

提供例子

除了告诉 GitHub Copilot 想要它做什么之外,还可以提供你喜欢的编码风格的例子来向其展示希望它做什么。虽然 GitHub Copilot 使用的 AI 模型已经接受过大量数据的训练,但向 GitHub Copilot 提供示例可以帮助其理解特定代码片段的上下文和约束。向人工智能模型展示希望它们做什么的示例是机器学习中的常见做法。

以下是工程师用来训练人工智能模型的一些方法:

  • 零样本学习(Zero-shot learning)

  • 单样本学习(One-shot learning)

  • 少样本学习(Few-shot learning)

我要求 ChatGPT 像我 5 岁的时候一样想我解释这些方法之间的区别,以下是它给我的内容:

零样本学习

这就像当你看到一个以前从未见过的新玩具,但你知道它是什么,因为它看起来像你见过的其他玩具。例如,如果你见过许多不同种类的毛绒动物,即使你以前从未见过这种动物,你也能够认出一种新的动物。类似的,计算机可以通过使用它对相似事物的了解来对新事物做出有根据的猜测,从而学习识别新事物。

单样本学习

这就像当你第一次看到一个新玩具,你的爸爸和妈妈告诉你玩具叫什么和用途。只要听过一次,你就可以记住它是什么,并且下次看到它时就能认出它。计算机可以学习和识别新事物用同样的方式通过仅展示几个例子并从中学习。

少样本学习

少样本学习就像通过只看几个例子来学习做新事情一样。例如,假设说你想学习如何画一只猫,但你之前只看过几张猫的图片。通过几次学习,即使你以前没有见过很多猫,你仍然可以学习如何画猫。它就像是一种魔力,可以帮助你快速学习新事物,即使你没有很多可供学习的例子。

以下是向 GitHub Copilot 提供示例和不提供示例时,它的回答。

不提供示例

# Create a list of the first 10 prime numbers
primes = []

for num in range(2, 30):
    if all(num % i != 0 for i in range(2, num)):
        primes.append(num)
print(primes)

在上面的代码片段中,Github Copilot 将准确返回前 10 个数字,但效率低,因为它将循环遍历 2 到 30 之间的所有 29 个数字。通过提供希望 GitHub Copilot 执行的操作的具体示例,可以获得更有效的结果。

提供示例

# Create a list of the first 10 prime numbers
# Example: [2, 3, 5, 7, 11, 13, 17, 19, 23, 29]
primes = []

for num in range(2, 30):
    if all(num % i != 0 for i in range(2, num)):
        primes.append(num)
    if len(primes) == 10:
        break
print(primes)

在上面的代码片段中,GitHub Copilot 将返回前 10 个素数并在找到全部 10 个时停止。目标是获得准确但快速的结果,在将其推向正确的方向后,GitHub Copilot 成功实现了这一目标。

附加建议

迭代你的提示

如果初始提示返回了所需的响应,可以删除生成的代码建议,使用更多详细信息和示例编辑评论,然后重试。对于你和 GitHub Copilot 来说,这是一个学习过程。使用它的次数越多,与 GitHub Copilot 沟通的就越顺畅。

在 IDE 中保持相关文件打开的选项卡

目前,GitHub Copilot 无法获取整个代码库的上下文。然而,它可以读取当前的文件以及在 IDE 中打开的任何文件。我发现保留希望 GitHub Copilot 引用的相关文件的选项卡是很有帮助的。例如,当我写一个依赖其他文件变量的函数,我将在 IDE 中保持该文件打开。这将有助于 GitHub Copilot 提供更准确的建议。

给你的 AI 助手一个身份

我从 BitRise 的开发者倡导者 Leilah Simone 收到建议。我尚未使用 GitHub Copilot 尝试此建议,但是这是有用的建议。它有助于控制用户收到的响应类型。在 Leila 的案例中,她要求 ChatGPT 表现的像一名高级的 IOS 工程师。她说:「这帮助她减少了语法和 linting 的问题」。

使用可预测模式

正如我们在上述许多种例子中看到的,GitHub Copilot 将遵循代码中的模式。AI 爱好者和开发者 YK aka CS Dojo ,分享了他如何利用这一点来发挥自己的优势:

在这里插入图片描述

对描述其用途的变量和函数使用一致的、特定的命名约束

声明变量或函数时,使用指定用于变量用途的名称。这将帮助 GitHub Copilot 了解变量的上下文并生成更多相关建议。例如,不要使用「value」等通用变量名称,而应使用「input_string」或 「output_file」。

GitHub Copilot 还将使用在代码中使用的命名约定。例如,如果使用驼峰式命名变量,GitHub Copilot 将建议驼峰式命名变量。如果你使用 snake_case 作为变量,GitHub Copilot 将建议 snake_case 变量。

使用良好的编码实践

虽然 GitHub Copilot 可以作为生成代码建议的强大工具,但请务必注意,它并不能取代你自己的编程技能和专业知识。人工智能模型的好坏取决于它们所训练的数据,因此,重要的是使用这些工具作为辅助工具,而不是完全依赖它们。我鼓励 GitHub Copilot 的每个用户:

  • review 代码

  • 运行单元测试、集成测试和任何其他形式的测试代码

  • 手动测试代码以确保其按预期工作

  • 并使用良好的编码实践,因为 GitHub Copilot 将遵循你的编码风格和模式作为其建议的指南

超越你的编译器

当前,GitHub Copilot 是最流行的 IDE 中的提供的扩展插件。还有 GitHub Copilot Labs,这是一个可通过 GitHub Copilot 访问的单独实验性扩展。Copilot Labs 可以帮助翻译、调试、测试、记录和重构代码。此外,还退出了 Copilot X,这是一套可以提高 IDE 之外的开发人员工作效率的功能。Copilot X 包括:

  • Copilot for Docs - 使开发人员免于搜寻大量的文档。
  • Copilot for Pull Requests - 帮助编写更好的 PR 描述并帮助团队更好的快速审查和合并 PR
  • Copilot Chat - 在编辑器中通过 GitHub Copilot 聊天获得类似的 ChatGPT 的体验
  • Copilot for CLI - 帮助记住 Shell 命令和标志,以编更快地在终端运行命令
  • Copilot Voice - 编写和编辑代码、浏览代码库以及用语音控制 Visual Studio Code

Copilot X 功能/产品目前处于技术预览阶段。如果想要使用上述功能之一,可以在 https://github.com/features/preview/copilot-x 上注册等待名单。

开始使用 GitHub Copilot 练习 prompt engineering

了解如何最佳使用 GitHub 的最佳方法就是开始使用它,可以在此处注册访问 GitHub Copilot https://github.com/features/copilot

如果你是企业领导者并且希望让团队访问 GitHub Copilot,可以在此处注册 GitHub Copilot https://github.com/github-copilot/business_signup/choose_business_type

让我们保持共同学习

感谢阅读本篇博文。我很想听听你的消息!我还在学习更多关于人工智能、GitHub Copilot、和 prompt engineering 的知识。如果是是 GitHub Copilot 的粉丝并且已经学会如何使用它来改进开发人员工作流程,可以在下面的评论中分享一些你的技巧。

另外,可以查看以下更多的资源了解有关 prompt engineering 的更多信息

  • How to get Codex to produce the code you want

  • Prompt Design from OpenAI

  • Prompt Engineering 101: Introduction to Codex

  • Prompt Engineering Guide by Elvis Saravia

参考资料

  • A Beginner’s Guide to Prompt Engineering with GitHub Copilot - DEV Community

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/57403.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

0139 数据链路层1

目录 3.数据链路层 3.1数据链路层的功能 3.2组帧 3.3差错控制 3.4流量控制与可靠传输机制 3.5介质访问控制 部分习题 3.数据链路层 3.1数据链路层的功能 3.2组帧 3.3差错控制 3.4流量控制与可靠传输机制 3.5介质访问控制 部分习题 1.数据链路层协议的功能不包括&…

【雕爷学编程】MicroPython动手做(30)——物联网之Blynk 2

知识点:什么是掌控板? 掌控板是一块普及STEAM创客教育、人工智能教育、机器人编程教育的开源智能硬件。它集成ESP-32高性能双核芯片,支持WiFi和蓝牙双模通信,可作为物联网节点,实现物联网应用。同时掌控板上集成了OLED…

docker删除容器(步骤详解)

要在Docker中删除容器,需要使用命令docker rm。 下面是详细步骤: 1. 首先,使用docker ps命令查看当前正在运行的容器。这个命令会列出所有正在运行的容器的ID、名称、状态等信息。 如果没有正在运行的容器可以通过docker ps -a 查看当前所…

数据结构 | Radix Tree 树

什么是基数树? 基数树是一种多叉搜索树,数据位于叶子节点上,每一个节点有固定的2^n个子节点(n为划分的基大小,当n为1时,为二叉树)。 什么为划分的基? 以一个64位的长整型为例&#x…

Day08-作业(MySQLMybatis入门)

作业1:多表查询 数据准备: 重新创建一个数据库 db03_homework 执行如下脚本,创建表结构,导入测试数据 -- 部门管理 create table tb_dept(id int unsigned primary key auto_increment comment 主键ID,name varchar(10) not n…

ubuntu git操作记录设置ssh key

用到的命令: 安装git sudo apt-get install git配置git用户和邮箱 git config --global user.name “用户名” git config --global user.email “邮箱地址”安装ssh sudo apt-get install ssh然后查看安装状态: ps -e | grep sshd4. 查看有无ssh k…

通过案例实战详解elasticsearch自定义打分function_score的使用

前言 elasticsearch给我们提供了很强大的搜索功能,但是有时候仅仅只用相关度打分是不够的,所以elasticsearch给我们提供了自定义打分函数function_score,本文结合简单案例详解function_score的使用方法,关于function-score-query…

【Spring】深究SpringBoot自动装配原理

文章目录 前言1、main入口2、SpringBootApplication3、EnableAutoConfiguration4、AutoConfigurationImportSelector4.1、selectImports()4.2、getAutoConfigurationEntry()4.3、getCandidateConfigurations()4.4、loadFactoryNames() 5、META-INF/spring.factories6、总结 前言…

Nginx实现反向代理和负载均衡

Nginx安装 本文章主要介绍下,如何使用Nginx来实现反向代理和负载均衡,Nginx安装和基础知识,可参考我的这篇文章 Nginx安装。 Nginx实现反向代理 实现反向代理需要准备两台Nginx服务器。一台Nginx服务器A,ip为 192.168.206.140&…

浅谈机器视觉

目录 1.什么是机器视觉 2.学习机器视觉需要掌握的知识 3.机器视觉的由来 4.机器视觉带来的福利 1.什么是机器视觉 机器视觉(Computer Vision)是人工智能领域中的一个分支,旨在通过模仿人类的视觉系统,使计算机能够理解和解释图…

【Leetcode】(自食用)找到消失的数字

step by step. 题目: 给你一个含 n 个整数的数组 nums ,其中 nums[i] 在区间 [1, n] 内。请你找出所有在 [1, n] 范围内但没有出现在 nums 中的数字,并以数组的形式返回结果。 示例 1: 输入:nums [4,3,2,7,8,2,3,1] 输…

Stable Diffusion教程(6) - 扩展安装

打开stable diffusion webUI界面 加载插件列表 依次点击扩展->可用->加载自 搜索插件 首先在搜索框输入你要安装的插件,然后点击插件后面的安装按钮 如果你需要的插件这里面没有找到,可通过通网址安装的方式安装。 在git仓库网址输入框输入的你插件…

分享 一个类似 ps 辅助线功能

效果图片: 提示:这里的样式我做边做了修改,根据个人情况而定。 //你也可以npm下载 $ npm install --save vue-ruler-tool特点 没有依赖可拖动的辅助线快捷键支持 开始使用 1. even.js /*** description 绑定事件 on(element, event, han…

FPGA项目设计:数字时钟

项目要求: 设计一个数字时钟,数码管前两位显示小时,数码管中间两位显示分钟,数码管后面两位显示秒。 项目设计: 系统框架图: 计数模块时序图: 代码实现: 计数模块: /…

举个栗子~Quick BI 技巧(2):创建柱线组合图

上一期举个栗子为数据粉们分享了如何简单几步创建趋势折线图,有一些数据粉发来疑问:如何利用 Quick BI 制作柱线图呢? 线柱图是一种非常重要且常用的组合图表,可以将两组数据在同一个表中直观的表达。今天的栗子,我们…

什么是头脑风暴法,有哪些原则?

1. 什么是头脑风暴法? 头脑风暴法(Brainstorming)是一种用于创造性思维和问题解决的方法。它旨在通过集体讨论和思维碰撞,激发团队成员的创造力和想象力,从而产生新的创意和解决方案。 在头脑风暴会议中&#xff…

【项目方案】OpenAI流式请求实现方案

文章目录 实现目的效果比对非stream模式stream模式实现方案方案思路总体描述前端方案对比event-source-polyfill代码示例前端实现遇到的问题与解决方法后端参考资料时序图关键代码示例后端实现时遇到的问题与解决方法实现目的 stream是OpenAI API中的一个参数,用于控制请求的…

Dockerfile构建Tomcat镜像(源码)

Dockerfile构建Tomcat镜像 目录 Dockerfile构建Tomcat镜像 1、建立工作目录 2、编写Dockerfile文件 3、构建镜像 4、测试容器 5、浏览器访问测试: 1、建立工作目录 [roothuyang1 ~]# mkdir tomcat[roothuyang1 ~]# cd tomcat/[roothuyang1 tomcat]# lsapach…

了解垃圾回收算法

点击下方关注我,然后右上角点击...“设为星标”,就能第一时间收到更新推送啦~~~ 垃圾回收(Garbage Collect)是Java语言中的一种自动内存管理机制,用于自动回收不再使用的对象所占用的内存空间。Java虚拟机会自动追踪和…

C# Microsoft消息队列服务器的使用 MSMQ

先安装消息队列服务器 private static readonly string path ".\\Private$\\myQueue";private void Create(){if (!MessageQueue.Exists(path)){MessageQueue.Create(path);}}private void Send(){Stopwatch stopwatch new Stopwatch();stopwatch.Start();Message…