AIGC工具系列之——基于OpenAI的GPT大模型搭建自己的AIGC工具

今天我们来讲讲目前非常火的人工智能话题“AIGC”,以及怎么使用目前的AI技术来开发,构建自己的AIGC工具
什么是AIGC?
AIGC它的英文全称为(Artificial Intelligence Generated Content),中文翻译过来就是“人工智能生成内容”,就是利用人工智能技术来创建文本、图像、音乐、视频或者其他的媒体内容的过程。这种技术的应用目前正在迅速扩展,因为它可以大大提高内容创建的效率,同时降低成本、除了降低成本之外。在某些情况下,它提供与人类创作者相媲美,甚至超越的作品。
AIGC的技术背景
AIGC它依赖于各种人工智能模型,特别是深度学习技术,如生成对抗网络(GANs),以及变分自编码器(VAEs)用于图像,以及自然语言处理(NLP)模型,如GPT(Generative Pre-trained Transformer)系列用于文本生成,这些技术通过学习大量数据中的模式,来生成全新的内容。

目前的AIGC代表工具:

文本生成工具
OpenAI的ChatGPT: 基于GPT(生成预训练变换器)模型,能够生成连贯、有逻辑的文本,适用于对话、文本创作等多种场景。
Google Bard: Google推出的对话型AI,旨在提供信息、娱乐以及创作帮助。

图像生成工具
OpenAI的DALL·E: 能够根据文本提示生成高质量、创意丰富的图像。
Midjourney: 是一个独立的研究实验室和社区,专注于使用AI生成图像。
Stable Diffusion: 一个开源的图像生成模型,支持个人和商业用途,能够根据文本提示生成图像。

音乐和声音生成工具
OpenAI的Jukebox: 能够生成音乐,包括旋律、节奏、和声,甚至可以模仿特定艺术家的风格。
Descript’s Overdub: 允许用户根据文本生成声音,可以用于语音编辑和生成。

视频生成工具
Runway: 提供了一个机器学习工具套件,允许用户创建、修改和生成视频内容。
Synthesia: 通过AI为企业和个人提供视频内容创作服务,特别是能够生成虚拟演讲者和自动化视频。

编程和代码生成工具
GitHub Copilot: 由OpenAI训练,能够根据现有代码和注释提示生成编程代码,支持多种编程语言。
深度伪造和合成媒体
Deepfakes: 软件和技术,能够在视频和音频文件中合成人类的面部和声音,通常用于娱乐、教育或创建虚假信息。

了解这些感念和专业技术词汇,以及这些AI工具之后,唯独没有国内的AIGC工具代表作品,果然搞技术的还得是人家外国佬厉害呀!既然没有国产的,那作为一个技术渣渣,那对不起了,我们就基于他们的基础上去搭建一个吧,这里演示怎么基于OpenAI的API接口去搭建一个我们自己的AIGC工具。

搭建框架图

在这里插入图片描述

搭建前的必备材料:

 1. 一台服务器
 2. openai的api key
 3. ssh客户端工具

(1)、教程点击这里,获取服务器地址:
https://bwh88.net/aff.php?aff=74320

(2)ssh客户端finalshell工具下载地址:
Windows X64版,下载地址
http://www.hostbuf.com/downloads/finalshell_windows_x64.exe
macOS Arm版,支持m1,m2,m3 cpu,下载地址
http://www.hostbuf.com/downloads/finalshell_macos_arm64.pkg
macOS X64版,支持旧款intel cpu,下载地址:
http://www.hostbuf.com/downloads/finalshell_macos_x64.pkg
Linux X64版,下载地址:
http://www.hostbuf.com/downloads/finalshell_linux_x64.deb
Linux Arm64版,下载地址:
http://www.hostbuf.com/downloads/finalshell_linux_arm64.deb
Linux LoongArch64龙芯版,下载地址:
http://www.hostbuf.com/downloads/finalshell_linux_loong64.deb
选择对应系统版本的下载安装即可。

(3)openai的api key的获取:
api_key获取步骤如下图:
(1)进入api keysyemian
在这里插入图片描述
(2)创建一个api key,然后复制保存下来
在这里插入图片描述

一、 服务器端安装openai API对接服务程序

  1. 登录服务器平台,进入后台选择stop停止服务器运行。
    在这里插入图片描述

  2. 安装系统,这里选择ubuntu最新版本,点击reload进行安装
    在这里插入图片描述

  3. 安装完成后,系统生成ssh端口号和密码,这里要把ssh端口号和密码记下来,等会儿ssh客户端登录需要用到
    在这里插入图片描述

  4. 打开ssh客户端
    在这里插入图片描述

  5. 创建一个ssh连接
    在这里插入图片描述

  6. 填写服务器IP地址,ssh端口,密码以及用户名,点击确认;
    在这里插入图片描述
    密码和端口号,就是第3部安装系统时生成的密码和ssh端口。IP 地址可以登录后台查看如下:

    如果密码也忘记了,可以点击重新生成,如下图操作:
    在这里插入图片描述
    在这里插入图片描述

  7. 双击新建的会话连接,进入服务器shell终端,如下图:
    在这里插入图片描述
    在这里插入图片描述

  8. 给服务器安装git工具,输入安装命令:apt install git 然后点击回车键运行。
    在这里插入图片描述

  9. 获取服务器端openai的API 对接服务代码。进入到home目录并运行如下指令:

cd /home
git clone https://github.com/wg520235/openai_project.git

在这里插入图片描述
下载完成如下图:
在这里插入图片描述

  1. 然后cd 进入工程目录openai_project,并运行app_install.sh脚本安装服务器程序。命令如下
cd openai_project/
sh app_install.sh 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 gpt-3.5-turbo dall-e-2

在这里插入图片描述
回车运行,安装过程中出现提示信息或者选择,一律按回车健Enter默认即可,大概几分钟之后即可安装完成,安装完成如下图:
在这里插入图片描述

【脚本参数说明】

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 //openai的api key
gpt-3.5-turbo //gpt版本
dall-e-2 //openai的绘画版本

如果你 开通了gpt4,gpt版本可以填写最新的gpt-4,绘画模型版本填写最新的:dall-e-3,如果你没有开通gpt4默认填写gpt-3.5-turbo和dall-e-2即可。
openai的api key获取:

打开AIGC客户端并连接服务器

这个客户端仅仅是本人为了调试功能测试用,其他做得不好的地方大家不要太在意,界面有点丑陋大家可以忽略,主要看功能即可。如各位大佬有兴趣,可以自己开发一个好看的客户端,这个客户端的代码我双手奉上,还望各位能够进一步开发完善,发扬光大,哈哈!
代码下载地址:

git clone https://github.com/wg520235/GPT_CLIENT_BASE_QT.git
  1. 下载GPT客户端工具,下载连接如下:
    git下载地址:
https://github.com/wg520235/openai_project/blob/main/AIOTNIK_GPT_CLIENT.zip

在这里插入图片描述

或者网盘下载:
链接:https://pan.baidu.com/s/1HCdCHuSqhX9dSrRzt8ik4g?pwd=3lm4
提取码:3lm4

2.减压GPT客户端工具,如下:

在这里插入图片描述
3.双击工具运行
在这里插入图片描述
界面如下:
在这里插入图片描述

  1. 点击设置按钮,填写你的服务器IP,点击确认连接成功后页面的功能即可使用。
    在这里插入图片描述
    成功连接你的服务器,点击ok即可像聊天gpt一样调用openai GPT的API 接口进行聊天绘画。
    在这里插入图片描述

AIGC客户端功能展示

2.和chatgpt一样对话聊天,文本写作,写代码等
在这里插入图片描述
在这里插入图片描述

  1. 调用openai的dall-e-3进行绘画,在输入框输入提示词,点击发送即可绘画,例如:

在这里插入图片描述
【注意】绘画的时候切记要先添加提示词”画:“或者"draw:",以区分是调用绘画模型dall-e-2进行AI 绘画。
目前GPT客户端支持图片双击变大效果如下,以及右键文本复制和图片下载保存到本地。
在这里插入图片描述
在这里插入图片描述
3.语音对话功能,调用了openai的asr,tts,以及chat接口实现的语音对话,点击语音对话按钮,然后你对着麦克风说话就行(想说啥说啥,把AI当作跟人说话一样就行),说完点击停止,然后等待AI 的回答即可。
(1)想微信语音一样,按下按钮输入语音
在这里插入图片描述
(2)点击停止按住,结束语音输入。
在这里插入图片描述
稍等片刻AI会返回语音,如果你电脑有扩音器(喇叭)就可以听到,如果没有扩音器,你们的对话也会转为文字显示在对话框上。

3.语音输入,即就是有的时候你不方便打字,你可输入语音,然后ai会以文字的方式回答你,并显示在对话框上。这个功能和语音对话相似,自行体验即可。

4.图片解析,这个就是你点击这个按钮上传一张图片,然后AI会解读你的图片内容,然后将AI 解读的内容返回到对话框,这个功能适用于名画鉴赏的。

在这里插入图片描述
例如我这里选择刚才AI 画的萝莉塔,上传后AI会返回如下解析结果:

  1. 图片播放,这个功能就我自己diy的,因为目前的sora很火,然后openai又还没有发布视频生成的API接口,所以我突发奇想,让AI画几十张连续的画,然后我把这些画放到一个文件夹里,然后以每秒25帧的速度播放这些图片,这不就可以生成视频了吗?但是结果没我想的那么好,最后还是等视频生成的API 接口发布了再做视频生成功能吧!
    在这里插入图片描述
    播放效果:https://live.csdn.net/v/373939

好了!到这里整个AIGC工具的开发,构建和使用就完了。还有很多功能没有做,如果你看到这篇文章,引起了你的兴趣,你可以基于我的工程基础之上去完善。大家一起玩转AI,躁起来.....哈哈哈!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/492757.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

共射极放大电路理论计算

目录: 1、概述 2、理论计算 3、Multisim仿真验证 1)静态工作点与放大倍数 2)输入阻抗仿真 1、概述 如下图所示的共射极放大电路,本内容主要计算静态工作点电压、电压放大倍数与输入输出阻抗。 2、理论计算 列出方程如下&am…

Apache Hive的基本使用语法

一、数据库操作 创建数据库 create database if not exists myhive;查看数据库 use myhive; desc database myhive;创建数据库并指定hdfs存储 create database myhive2 location /myhive2;删除空数据库(如果有表会报错) drop database myhive;…

【机器学习300问】54、如何找到有效的组合特征?

一、为什么需要去寻找有效的组合特征? 因为并不是所有的特征组合都会意义,都能带来价值。 例如在房价预测场景中,卧室数量和浴室数量的比值有意义,但房屋面积与建造年份相组合作为新的组合特征,可能就没有实际含义&…

Redis中的事件(二)

文件事件 文件事件的处理器 Redis为文件事件编写了多个处理器,这些事件处理器分别用于实现不同的网络通信需求,比如说: 1.为了对连接服务器的各个客户端进行应答,服务器要为监听套接字关联连接应答处理器2.为了接收客户端传来的命令请求&a…

零基础自学C语言|文件操作

✈为什么使用文件? 如果没有文件,我们写的程序的数据是存储在电脑的内存中,如果程序退出,内存回收,数据就丢失了,等再次运行程序,是看不到上次程序的数据的,如果要将数据进行持久化…

EFI Driver Model(下)-SCSI 驱动设计

1、SCSI简介 SCSI是Small Computer System Interface(小型计算机系统接口)的缩写,使用50针接口,外观和普通硬盘接口有些相似。SCSI硬盘和普通IDE硬盘相比有很多优点:接口速度快,并且由于主要用于服务器&…

记一次Tomcat启动失败的经历

首先,下载tomcat10.1.20后,双击启动bin下的startup.bat闪退,查了资料,说是依赖JDK环境和JRE环境,当然,我Java是能正常用的,毕竟写了这么多东西它有没有我还不清楚吗 可问题就来了,既…

软件应用实例,租赁系统软件操作教程,脚手架租赁管理集装箱租赁管理系统教程

软件应用实例,租赁系统软件操作教程,脚手架租赁管理集装箱租赁管理系统教程 一、前言 以下软件操作教程以,佳易王租赁管理系统软件V17.0为例说明 件文件下载可以点击最下方官网卡片——软件下载——试用版软件下载 1、软件可以记录&#x…

GEE土地分类——分类后样本点值提取至点过程中,导出的csv数据表中不存在geometry的位置信息

值提取至点导出的csv数据表中不存在geometry的位置信息 错误提示: {"type":"MultiPoint","coordinates":[]} 问题分析 问题主要出现在在reduceregions中所使用的第二个参数中。在reduceregions中,第二个参数用于指定geometry信息,以便将r…

约克中央空调YES-will系列,舒适冷暖与高品质家居的优选

漫漫寒冬,室内一片寒意,开启空调多久才能享受到暖意?如果冬季气温较低,空调能否保持正常的制热运行? 炎炎夏季,即便在室内也同样是“暴汗”不断,身上黏糊糊,什么样的家用中央空调才能快速制冷,让全家人感受到舒适,同时又能避免传统空调直吹带来的一系列问题? 遇上梅雨季节…

【采购季】全网云服务器采购季活动大盘点 网站博客搭建、程序员职场毕业神器 低至50/年 阿里云 京东云 腾讯云

《最新对比表》已更新在文章头部—腾讯云文档,文章具有时效性,请以腾讯文档为准! 【腾讯文档实时更新】云服务器1分钟教会你如何选择教程 2024-开年采购活动 云服务器专区 京东云 阿里云 腾讯云 配置最新价格表 与 官方活动地址 ​ 当前活动…

双碳目标下基于全球模式比较计划CMIP6与区域气候-化学耦合模式WRF-Chem的未来大气污染变化模拟教程

原文链接:双碳目标下基于全球模式比较计划CMIP6与区域气候-化学耦合模式WRF-Chem的未来大气污染变化模拟教程https://mp.weixin.qq.com/s?__bizMzUzNTczMDMxMg&mid2247599209&idx7&sn2fb78bcb18e6ec709853a7595d8822d9&chksmfa82058ecdf58c9852bf4…

鸿蒙HarmonyOS应用开发之使用Node-API接口进行异步任务开发

场景介绍 napi_create_async_work是Node-API接口之一,用于创建一个异步工作对象。可以在需要执行耗时操作的场景中使用,以避免阻塞主线程,确保应用程序的性能和响应性能。例如以下场景: 文件操作:读取大型文件或执行复…

朋友圈运营攻略,还有多号群发朋友圈教程

为什么需要打造朋友圈? 私域朋友圈运营运营者和私域流量理论上其实就是“网友”的关系 要维持稳定的社交关系,做好私域流量运营,就必须持续地进行自身价值塑造!而朋友圈就是最好的“战场” 打造优质朋友圈的关键点: …

09 网络ARP请求,响应,ICMP协议

arp协议_arp请求_arp回应 ICMP包构造ping搜狐服务器参考 #include <stdio.h> #include <sys/types.h> /* See NOTES */ #include <sys/socket.h> #include <linux/if_packet.h> #include <linux/if_ether.h> #include <string.h> #includ…

文案转化率低?快看看这两个坑你踩没踩

对于很多中小企业来说&#xff0c;无论是来拓市场还是获客&#xff0c;软文营销都会成为他们的主要营销方式&#xff0c;比较软文营销的成本较低&#xff0c;同时门槛也不高。但是也有品牌发现&#xff0c;自己和团队辛苦构思了几周写出的文案&#xff0c;但是效果不是很好。今…

五、Elasticsearch 集成

目录 5.1 Spring Data 框架集成5.1.1 Spring Data 框架介绍5.1.2 Spring Data Elasticsearch 介绍5.1.3 Spring Data Elasticsearch 版本对比5.1.4 集成步骤 5.1 Spring Data 框架集成 5.1.1 Spring Data 框架介绍 Spring Data 是一个用于简化数据库开发的开源框架。其主要目…

前端 CSS 经典:grid 栅格布局

前言&#xff1a;Grid 布局是将容器划分成"行"和"列"&#xff0c;产生单元格&#xff0c;然后将"项目"分配给划分好的单元格&#xff0c;因为有行和列&#xff0c;可以看作是二维布局。 一 术语 1. 容器 采用网格布局的区域&#xff0c;也就是…

【机器学习之旅】概念启程、步骤前行、分类掌握与实践落地

&#x1f388;个人主页&#xff1a;豌豆射手^ &#x1f389;欢迎 &#x1f44d;点赞✍评论⭐收藏 &#x1f917;收录专栏&#xff1a;机器学习 &#x1f91d;希望本文对您有所裨益&#xff0c;如有不足之处&#xff0c;欢迎在评论区提出指正&#xff0c;让我们共同学习、交流进…

六、保持长期高效的七个法则(二)Rules for Staying Productive Long-Term(2)

Rule #5 - If your work changes, your system should too. 准则五&#xff1a;如果你的工作变了&#xff0c;你的系统也应该改变。 For some, work will be consistent enough to not need major changes.You simply stick to the same system and you’ll get the results y…