Application Development using Large Language Models笔记

诸神缄默不语-个人CSDN博文目录

这是2023年NeurIPS Andrew Ng和Isa Fulford做的tutorial,关于如何用LLM来开发新产品的技术和思路:NeurIPS Tutorial Application Development using Large Language Models

文章目录

  • 1. LLM基础
  • 2. 提示工程技巧
  • 3. 微调
  • 4. AI创业和其他应用思路

1. LLM基础

LLM base的思路是“预测下一个token”,LLM聊天模型的思路是对齐instructuion(指令),也就是用问答对来继续预训练LLM。这样能让LLM有回答问题 / 遵从指令的能力。
RLHF,对齐人类需求:人工对LLM回答结果打分(实现是比较哪个回答更好),学习人工打分的reward model

2. 提示工程技巧

  1. 加reference
  2. 重复问,用类似模型聚合的方式
  3. 分解任务:分类query
  4. moderation API:检测安全性
  5. 防止prompt injection:
    1. 将用户输入从prompt中分隔出来
      在这里插入图片描述
      2. 多问一次,有没有prompt injection
  6. 用户给出的例子、低资源语言prompt、代码、“奶奶讲故事”可能会绕过安全限制

3. 微调

  1. 也许只需要200-500个样本

4. AI创业和其他应用思路

  1. 分解人类的实际工作内容,根据技术的可获得性判断AI在哪一步可能有用
  2. 及时监控LLM输出
  3. 评估LLM的表现:制作测试集和评估指标
  4. 用LM评估指标:这一点我记得另外有一篇paper说LLM更倾向于同一LLM生成的结果来着,忘了具体是哪篇了,下次找找
  5. 这玩意仍然难以debug(我对此深有感触)
  6. 定义specific and narrow use case,明确评估指标、成功的标准,评估风险
  7. 用LLM让工作流程更简单、更便宜
  8. LLM基座模型可能会自己变好(什么,AI界自己的摩尔定律)
  9. personalized LLM可能需要LLM在每一层都努力,pretraining阶段就需要考虑文化差异,RLHF阶段有personalized RLHF、group wise RLHF、不同的甚至冲突的preference
  10. LLM的置信度:简单方案是直接问LLM你的confidence是多少;更好的方法是抽样多条回答,检查其一致性
  11. 闭源模型效果好但不好调,还想要长记忆,还想要用户能够实时反馈并得以调整:Andrew的建议是模仿人类的思路一步一步来,这样也方便做错误分析

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/638380.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

图片、视频画质增强变清晰工具分享(免费)

生活中可能会修一下模糊图片那么这就有一款用来修图片的管理工具,也有可能会修一下模糊的视频,在吾爱上有大佬开发了这么一款工具,免费的,不需要开任何VIP,我试了一下,好用,分享出来&#xff0c…

linux 上除了shell、python脚本以外,还有什么脚本语言用得比较多?

在开始前我有一些资料,是我根据网友给的问题精心整理了一份「 Linux的资料从专业入门到高级教程」, 点个关注在评论区回复“888”之后私信回复“888”,全部无偿共享给大家!!!说到在 Linux下的编程&#xf…

TypeScript-泛型

泛型(Generics) 指在定义接口,函数等类型的时候,不预先指定具体的类型,而在使用的时候再指定类型的一种特性,使用泛型可以复用类型并且让类型更加灵活 泛型接口-interface 语法:在 interface 接口类型的名称后面使用…

如何使用Unity XR Interaction Toolkit

使用环境: Unity2021.3.21f XR Interaction Toolkit v3.0.0 各类函数可用的: 简单项目配置: 第一步,导包(samples可以不用导这么多,两个就够了): 第二步,构建场景&a…

基于STM32实现智能空气质量监测系统

目录 文章主题环境准备智能空气质量监测系统基础代码示例:实现智能空气质量监测系统 配置传感器并读取数据数据处理与显示数据存储与传输应用场景:室内环境监测与空气质量控制问题解决方案与优化收尾与总结 1. 文章主题 文章主题 本教程将详细介绍如何…

Xline社区会议Call Up|在 CURP 算法中实现联合共识的安全性

为了更全面地向大家介绍Xline的进展,同时促进Xline社区的发展,我们将于2024年5月31日北京时间11:00 p.m.召开Xline社区会议。 欢迎您届时登陆zoom观看直播,或点击“阅读原文”链接加入会议: 会议号: 832 1086 6737 密码: 41125…

【人工智能】模型性能评估

模型性能衡量介绍 混淆矩阵 混淆矩阵(Confusion Matrix) TP(真阳性):预测为阳性,且预测正确。 TN(真阴性):预测为阴性,且预测正确。 FP(伪阳性):预测为阳性,但预测错误,又称型一误…

Generic Segmentation Offload(GSO)

Generic Segmentation Offload汉语意思是啥? Generic Segmentation Offload(GSO)的汉语意思是“通用分段卸载”。在网络通信中,GSO 是一种技术,用于在网络栈中将较大的传输单元分段为更小的单元,以提高网络…

Ai指令-公众号内训课:学会ai指令+公众号的底层逻辑(7节课)

课程目录 第一课:详解公众号的流量机制.mp4 第二课:快速搞定公众号号设化装修.mp4 第三课:一期学员直呼牛X的课程,正确的爆文利用姿势.mp4 第五课:颗粒度级别拆解AI公众号爆文.mp4 第六课:AI提示词进阶技巧课。提示词自动化.mp4 第七课.实操演示提示词撰写工作…

web自动化之PO模式

PO模式 1、为什么需要PO思想? 首先我们观察和思考一下,目前我们写的作业脚本的问题: 元素定位和操作动 作写到一起了,这就就会用导致一个问题: UI的页面元素比较容易变化的,所以元素定位和脚本操作写到一…

24-LINUX-UDP网络连接

一UDP协议特点 TCP 协议提供的是:面向连接、可靠的、字节流服务。使用 TCP 协议通信的双发必须 先建立连接,然后才能开始数据的读写。双方都必须为该连接分配必要的内核资源,以管理 连接的状态和连接上数据的传输。TCP 连接是全双工的&…

Controlnet作者放出新的大招 IC-Light,可以操控图像生成时的光照,对内容主体重新打光生成符合新背景环境光照的图片

IC-Light代表Impose Constant Light,是一个控制图像照明的项目。可以操控图像生成时的光照,对内容主体重新打光生成符合新背景环境光照的图片。这下商品图合成这种需要最大程度保持原有主体 ID 需求的最大的问题解决了。 目前,已经发布了两种类型的模型…

多线程、进程、线程五种状态、synchronized、volatile、Lock、CAS、死锁、ThreadLocal

1、并发编程 并发编程三要素 原子性:只一个操作要么全部成功,要么全部失败可见性:一个线程对共享变量的修改,其他线程能够立刻看到有序性:程序执行的顺序按照代码的先后顺序执行 synchronized,Lock解决原…

C++ 网络编程

一、Reactor 网络编程模型 reactor 是一个事件处理模型。网络处理:因为用户层并不知道 IO 什么时候就绪,所以将对 IO 的处理转化为对事件的处理。网络模型构成: 非阻塞 IO:操作 IO,如果 IO 未就绪,IO 函数会立刻返回。IO 多路复用:检测多路 IO 是否就绪。工作流程: 注册…

【设计模式】JAVA Design Patterns——Bridge(桥接模式)

🔍目的 将抽象与其实现分离,以便二者可以独立变化。 🔍解释 真实世界例子 考虑一下你拥有一种具有不同附魔的武器,并且应该允许将具有不同附魔的不同武器混合使用。 你会怎么做? 为每个附魔创建每种武器的多个副本&…

每周刷题第三期

个人主页:星纭-CSDN博客 系列文章专栏:Python 踏上取经路,比抵达灵山更重要!一起努力一起进步! 目录 题目一:环形链表 题目二:删除有序数组中的重复项 题目三:有效的括号 题…

【C语言】程序员自我修养之文件操作

【C语言】程序员自我修养之文件操作 🔥个人主页:大白的编程日记 🔥专栏:C语言学习之路 文章目录 【C语言】程序员自我修养之文件操作前言一.文件介绍1.1为什么使用文件1.2文件分类1.3二进制文件和文本文件 二.文件的打开和关闭2.…

docker-compose Install homer

homer前言 一个非常简单的静态主页,为您的服务器保持您的服务在手,从一个简单的yaml配置文件。 前提要求 安装 docker docker-compose 参考创建一键安装homer 脚本 homer安装位置/homerhomer 脚本位置/homer/assetshomer logo 图标/home/assets/iconshomer 端口80homer 颜色…

连续三次拒绝饭局的邀请,不会在有人请你吃饭!

人们对于饭局的态度各有不同,有的认为饭局纯属浪费时间,还有各种套路,应该尽量少参加。也有的人认为饭局是沟通感情的平台,有这样的机会应该尽量去参与。不管是否喜欢饭局,但总要时不时去参加的。如果你连续三次拒绝饭…

文心智能体应用示例:职场反PUA专家的诞生

🧑 博主简介:阿里巴巴嵌入式技术专家,深耕嵌入式人工智能领域,具备多年的嵌入式硬件产品研发管理经验。 📒 博客介绍:分享嵌入式开发领域的相关知识、经验、思考和感悟,欢迎关注。提供嵌入式方向…