ChatGPT基础(一) GPT的前世今生

文章目录

      • GPT模型简史
      • GPT系列模型
      • ChatGPT的应用

最近ChatGPT3.5可以免注册使用了,出来刨一波坟 说一说ChatGPT的来源和应用。

在这里插入图片描述

GPT模型简史

Generative pre-trained transformers(GPT)生成式预训练转换模型是大语言模型的一种(Large Language Model–>LLM)。它是用于自然语言处理的人工神经网络,可以在未经标记的语料上进行训练并能在基础的信息上生成出全新的内容。

GPT的前身可以追溯到2015年由Ian Goodfellow等人在论文《Generative Adversarial Nets》中首次提出,该模型使用生成对抗网络(GAN)学习生成数据,从而能够生成高质量的图像和文本。2018年,OpenAI基于GAN模型的思想发布了一款新的自然语言处理模型——GPT-1。

在这里插入图片描述

GPT系列模型

GPT模型是由OpenAI发布的一系列模型的总称。

在这里插入图片描述

GPT-1: 2018年11月OpenAI发布了GPT-1,是以4.5GB的文本资料作为训练数据得到的模型,该模型有接近1.2亿个参数。GPT-1是一个单向的语言模型它在预测下一个单词时,只考虑了前面的单词,效果一般。

GPT-2: 为了改进GPT-1的性能,OpenAI在2019年2月发布了GPT-2,新模型基于40GB的文本资料训练得到,有15亿个参数 是当时最大的语言模型之一。与GPT-1相比,GPT-2的文本处理能力有了显著提升,它可以生成更加自然和流畅的语言。

GPT-3: 在GPT-2的基础上,OpenAI 2020年又开发了一款更加强大的自然语言处理模型——GPT-3。GPT-3以570GB的资料作为语料训练得到,有1750亿个参数。

GPT-3.5: 在GPT-3的基础上,2022年3月OpenAI发布了GPT3.5模型,该模型同样也有1750亿个参数,并且基于GPT3.5推出了对应的聊天机器人ChatGPT,自此OpenAI一战封神,将人工智能推上了巅峰。

GPT-4.0: 2023年3月OpenAI推出了GPT-4.0,该模型据说有1.7万亿个参数,可以同时处理文字和图像号称地表最强大模型,只不过收费了价格还不便宜。

ChatGPT的应用

基于GPT-3.5的思想,OpenAI开发了一个针对对话场景的自然语言处理机器人——ChatGPT。具有强大的对话生成能力,它可以生成自然流畅的对话。它还可以进行问题回答、图像描述、翻译、文本分类、知识图谱等多种自然语言处理任务。ChatGPT已经成为一个非常受欢迎的自然语言处理模型,被广泛应用于智能客服、智能问答、聊天机器人等领域。

1.智能问答: 可以智能回答各个领域的知识问题,答案质量好 响应快。

2.文本翻译: 可以进行文本和内容的翻译。

3.摘要总结: 可以总结提取大段文章和内容的核心要点,梳理内容脉络.。

4.文本生成: 可以根据关键字和内容提示,生成新的文章,用来写小作文很不错 例如生成诗歌、新闻报道、小说等。

5.信息检索: 可以快速帮你梳理和查找对应领域的知识点和内容。

6.聊天机器人: 可以作为聊天机器人使用,与您进行简单的对话并提供有用的信息和资源。

7.情感分析: 可以分析文本的情感,并判断其中是否包含正面、负面或中性情感。

8.图像描述: 可以根据输入的图像生成文字描述,不过得用GPT4.0,GPT3.5目前不支持图像的处理。

9.搜索引擎优化: 如果有网站或者博客,它可以提供有关搜索引擎优化的建议和技巧.

10.知识图谱:它可以提供有关特定主题的知识图谱,并且可以回答与知识图谱相关的问题。

11.辅助编程: 可以回答各种编程相关的问题,并且可以为编程者提供建议和帮助。

注: 知识图谱是一种强大的知识表示和组织方式,通过将信息以图形结构的形式表示出来,使得计算机能够更好地理解和利用这些知识,从而实现各种智能应用.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/525155.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C语言高效的网络爬虫:实现对新闻网站的全面爬取

1. 背景 搜狐是一个拥有丰富新闻内容的网站,我们希望能够通过网络爬虫系统,将其各类新闻内容进行全面地获取和分析。为了实现这一目标,我们将采用C语言编写网络爬虫程序,通过该程序实现对 news.sohu.com 的自动化访问和数据提取。…

深入理解GO语言——GC垃圾回收二

文章目录 前言一、Go V1.5的三色并发标记法总结 前言 书接上回,无论怎么优化,Go V1.3都面临这个一个重要问题,就是mark-and-sweep 算法会暂停整个程序 。 Go是如何面对并这个问题的呢?接下来G V1.5版本 就用 三色并发标记法 来优…

深入MyBatis的动态SQL:概念、特性与实例解析

MyBatis 是一个优秀的持久层框架,它支持定制化 SQL、存储过程以及高级映射。 MyBatis 避免了几乎所有的 JDBC 代码和手动设置参数以及获取结果集。它可以使用简单的 XML 或注解来配置和映射原始类型、接口和 Java POJO,即普通的 Java 对象为数据库中的记…

混合云构建-如何通过Site to Site VPN 连接 AWS 和GCP云并建立一个高可用的VPN通信

如果我们的业务环境既有AWS云又有GCP云,那么就需要将他们打通,最经济便捷的方式就是通过Site-to-Site VPN连接AWS和GCP云,你需要在两个云平台上分别配置VPN网关,并建立一个VPN隧道来安全地连接这两个环境,稍微有些复杂繁琐,以下是详细步骤的动手实践: 一、在GCP 云中创…

通过自动化部署消除人为操作:不断提高提交部署比率

三十年后,我仍然热爱成为一名软件工程师。事实上,我最近读了威尔拉森(Will Larson)的《员工工程师:超越管理轨道的领导力》,这进一步点燃了我以编程方式解决复杂问题的热情。知道雇主继续照顾员工、原则和杰…

pyside6,“提升为”的部件使用困惑

在Qt designer中,新建一个QMainWindow,新建一个QWidget,并命名为widget,如图: 新建NewClass.py,输入代码: # encoding: utf-8 from PySide6.QtWidgets import QWidgetclass NewClass(QWidget):…

关于Mac使用idea问题

多窗口切换问题 如果出现Mac打开idea新的项目,发现始终就一个窗口,不能像window那样多窗口,比如 只能这样来回点着切换,提供以下方案 1.方案一 则在idea里多个项目会呈tab页切换,也是始终一个窗口,只是多了…

SpringCloud Alibaba Sentinel 简介和安装

一、前言 接下来是开展一系列的 SpringCloud 的学习之旅,从传统的模块之间调用,一步步的升级为 SpringCloud 模块之间的调用,此篇文章为第十三篇,即介绍 SpringCloud Alibaba Sentinel 简介和安装。 二、Sentinel 简介 2.1 Sent…

STM32CubeMX配置步骤详解七 —— 时钟及其它内部参数配置(2)

接前一篇文章:STM32CubeMX配置步骤详解六 —— 时钟及其它内部参数配置(1) 本文内容主要参考: STM32CUBEMX配置教程(一)基础配置-CSDN博客 野火STM32系列HAL库开发教程 —— 第12讲 STM32的复位和时钟控制…

docker一键部署GPU版ChatGLM3

一键运行 docker run --gpus all -itd --name chatglm3 -p 81:80 -p 6006:6006 -p 8888:8888 -p 7860:7860 -p 8501:8501 -p 8000:8000 --shm-size32gb registry.cn-hangzhou.aliyuncs.com/cwp-docker/chatglm3-gpu:1.0 进入容器 docker exec -it chatglm3 /bin/bash cd /…

企业版ChatGPT用户激增至60万;百度文心一言推出个性化声音定制功能

🦉 AI新闻 🚀 企业版ChatGPT用户激增至60万 摘要:OpenAI首席运营官Brad Lightcap在接受采访时透露,企业版ChatGPT的注册用户已超60万,相较2024年1月的15万用户,短短三个月内增长了300%。这一版本自2023年…

【Java】maven是什么?

先看一下基本概念: ①Maven 翻译为"专家","内行"是跨平台的项目管理工具。 主要服务于基于Java平台的项目构建,依赖管理和项目信息管理。 ②项目构建 项目构建过程包括【清理项目】→【编译项目】→【测试项目】→【生成测试报…

js 数组 按列循环二维数组

期待效果&#xff1a; 核心代码&#xff1a; //js function handle(array) {var result [];for (let i 0; i < array[0].length; i) {var item []; for (let j 0; j < array.length; j) {item.push(array[j][i])} result.push(item);} return result; } 运行代码&a…

14 Python进阶:math模块和requests 模块

常用方法 Python3 的 math 模块提供了许多数学函数&#xff0c;用于执行常见的数学运算。以下是 math 模块中一些常用方法的简介&#xff1a; 数值运算函数&#xff1a; math.sqrt(x)&#xff1a;返回 x 的平方根。math.pow(x, y)&#xff1a;返回 x 的 y 次幂。math.exp(x)&a…

TiDB MVCC 版本堆积相关原理及排查手段

导读 本文介绍了 TiDB 中 MVCC&#xff08;多版本并发控制&#xff09;机制的原理和相关排查手段。 TiDB 使用 MVCC 机制实现事务&#xff0c;在写入新数据时不会直接替换旧数据&#xff0c;而是保留旧数据的同时以时间戳区分版本。 当历史版本堆积过多时&#xff0c;会导致读…

Golang | Leetcode Golang题解之第13题罗马数字转整数

题目&#xff1a; 题解&#xff1a; var symbolValues map[byte]int{I: 1, V: 5, X: 10, L: 50, C: 100, D: 500, M: 1000}func romanToInt(s string) (ans int) {n : len(s)for i : range s {value : symbolValues[s[i]]if i < n-1 && value < symbolValues[s…

MySQL - MySQL数据库的事务(一)

1. 回顾一下MySQL运行时多个事务同时执行是什么场景 平时我们执行增删改的时候,无非就是从磁盘加载数据页到buffer pool的缓存页里去,对缓存页进行更新,同时记录下来undo log回滚日志和redo log重做日志,应该的是事务提交之后MySQL挂了恢复数据的场景,以及事务回滚的场景…

AcWing 3. 完全背包问题

解题思路 不过这种方式是有序的&#xff0c;而不是无序的。 相关代码 import java.util.Scanner;public class Main{static long f[] new long[1010];static int v[] new int[1010];static int w[] new int[1010];public static void main(String[] args){Scanner scan n…

Windows Docker 部署 PostgreSQL 数据库

一、简介 PostgreSQL是一个功能强大且特性齐全的对象-关系型数据库管理系统&#xff0c;它以加州大学计算机系开发的POSTGRES为基础&#xff0c;并具备高度自由开源的特性。PostgreSQL支持大部分SQL标准&#xff0c;提供了复杂查询、外键、触发器、视图、事务完整性以及多版本…

Android 11属性系统初始化流程

在init进程启动的第二阶段&#xff0c;调用PropertyInit 对属性系统进行初始化 int SecondStageMain(int argc, char** argv) {//省略PropertyInit();//省略 }PropertyInit函数在system\core\init\property_service.cpp 中实现 void PropertyInit() {//省略mkdir("/dev/…