李宏毅机器学习入门笔记——第六节

对抗生成式网络(GAN)

输入一个问题输出不同的答案出来
GAN里面有生成器和鉴别器
生成器

鉴别器
在这里插入图片描述
不断对抗生成,进行两者的网络

算法步骤

在这里插入图片描述
这里输出的结果可以是分类的,也可以是回归的。
在这里插入图片描述
两者训练过程,是固定生成器,训练鉴别器。又或是固定鉴别器,训练生成器。
在这里插入图片描述

GAN的理论知识

在这里插入图片描述
找到一组生成器参数将输出结果和真实数据结果分布足够接近。
在这里插入图片描述
将生成器生成的数据集和真实数据集一同进入到鉴别器进行训练,将真是结果输出较高,将生成器结果输出值设较低,进行训练。
如同上面的函数V计算机最大的值,等同于损失函数计算最小值。
在这里插入图片描述
假如两者差别很小,则V的最大值很小,假如两者差别很大,则V最大值便会很大,容易分辨.
在这里插入图片描述

GAN的训练技巧

在这里插入图片描述
在这里插入图片描述
不使用JS分类的话,使用其它距离进行计算。
在这里插入图片描述
在这里插入图片描述
使用这种分类损失计算的,叫做WGAN。
在这里插入图片描述
需要进行D函数的限制,将real和generated的差距不能趋于无穷。
在这里插入图片描述
但是对于这个函数的限制,现在具有三种方式。如上。在这里插入图片描述
GAN的训练过程,是生成器和鉴别器的相互对抗进行训练,当其中一者不动进步的时候,便会停止训练。

GAN的评估

在这里插入图片描述
对于影像评估而言,人为识别的成本是很高的,但是可以设置一个影像评估系统进行分类计算,将图像分类结果变为平均,更为接近,结果更好,但是存在会存在一个问题。
在这里插入图片描述
生成器集中生成于一种结果。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Conditional GAN

在这里插入图片描述
存在一个问题,就是假如D网络,只需要判断清晰的图片,就表示正确结果1,就会导致G网络不会关联输入的条件变量的问题 ,解决的方式就是将D网络和输入参数进行相关联。
在这里插入图片描述
在这里插入图片描述
监督学习可能存在将输出的结果进行平均起来,但是GAN会进行鉴别,但是存在想象力过于丰富的问题,出现不存在的细节,所以使用监督学习加上GAN能够得到一个更好的结果。

GAN用在无监督学习上

不需要成对的资料进行训练。
在这里插入图片描述
例如,对于真实的人物图像需要输出二次元的图像结果,但是对于实际成本而言,二次元图像绘画成本很高,不可能有成对的数据进行监督训练。
在这里插入图片描述
生成器生成一个二次元图片,鉴别器D鉴别判断结果,但是存在一个问题,就是生成器会被训练得随机生成一个与真实图片毫无关系得二次元图片进行输出,导致结果和真实图片相关性不大。所以使用传统得GAN是不够,所以使用Cycle GAN。
在这里插入图片描述
增加多一个生成器,将生成得二次元图片经过一个生成器,生成接近真实图片的图片。但是能够保证输出的二次元和真实图片有一定关系,但是存在训练得出一些错误的关系,奇怪的转换。目前来说没有什么很好的解决方式进行处理。
在这里插入图片描述
再进行一个步骤,将二次元图片生成人像图片进行循环操作。

GAN详细解说

在这里插入图片描述
对于生成图像与真实图像的相似性计算过程。
在这里插入图片描述
在这里插入图片描述
对于高斯分布的随机数据输入,经过神经网络计算后,所有输出结果的情况分布会不同于输入时候的分布,设置为Pg分布。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

这里图像中G3是效果最好的,主要是G3满足了V最大值存在相比于其它最小的情况。
在这里插入图片描述
在这里插入图片描述
算法过程不断迭代,进行微分计算,寻找最优的位置。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/415411.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

主流开发环境都有哪些?主流开发语言都有什么?

目录 一、简介: 二、主流开发环境: 三、主流开发语言: 四、结论: 一、简介: 在现代软件开发领域,选择适合自己需求的开发环境和开发语言至关重要。本文将介绍目前主流的开发环境和开发语言,…

深度学习--神经网络基础

神经网络 人工神经网络( Artificial Neural Network , 简写为 ANN )也简称为神经网络( NN ),是一种模仿生物神经网络结构和 功能的计算模型 。人脑可以看做是一个生物神经网络,由众多的 神经元…

国际黄金价格是什么?和黄金价格有何区别?

黄金是世界上最珍贵的贵金属之一,其价值被无数人所垂涎。而国际黄金价格作为市场上的参考指标,直接影响着黄金交易的买卖。那么国际黄金价格到底是什么,与黄金价格又有何区别呢?本文将为您详细解答。 国际黄金价格是指以美元计量的…

部署PhotoMaker通过堆叠 ID 嵌入自定义逼真的人物照片

PhotoMaker只需要一张人脸照片就可以生成不同风格的人物照片,可以快速出图,无需额外的LoRA培训。 安装环境 python 3.10gitVisual Studio 2022 安装依赖库 git clone https://github.com/bmaltais/PhotoMaker.git cd PhotoMaker python -m venv venv…

idea如何建立一个springboot项目

1.打开File -New-Project 2.填写相关信息,Name:### Type:Maven Croup、Artifact、java 版本 注:此时,第一次打开可能会报错,说版本不匹配。注意下方的两个红框,将Server URL的地址改为“https://start.aliyun.com ”…

C#理论 —— 基础语法、数据类型、变量、常量、运算符、三大结构

文章目录 1. 基础语法1.1 标识符命名规则1.2 C# 关键字1.3 C#注释 2. 数据类型2.1 值类型(Value types)2.2 引用类型(Reference types)2.2.1 对象(Object)类型3.2.2 动态(Dynamic)类…

Vue 环境安装以及项目创建

环境安装 nodejs 安装 下载地址:https://nodejs.org/dist/v18.16.1/ 根据系统类型选择对应安装包,选择安装路径那个后一直下一步即可安装完成。 配置npm 代理镜像,设置为淘宝的镜像地址(后面按照依赖可以加速下载安装包) npm c…

Java介绍

计算机语言历史 1、软件的分类 软件从架构上分类: C/S(Client/Server):基于客户端和服务器 B/S(Browser/Server):基于浏览器和服务器 如何区分:如果使用时要安装则为C/S架构的,如果使用时用浏览器打开则为B/S架构 由于…

RDMA技术在Apache Spark中的应用

背景介绍 在当今数据驱动的时代,Apache Spark已经成为了处理大规模数据集的首选框架。作为一个开源的分布式计算系统,Spark因其高效的大数据处理能力而在各行各业中广受欢迎。无论是金融服务、电信、零售、医疗保健还是物联网,Spark的应用几…

共同学习|Spring Cloud Alibaba一一sentinel介绍

Sentinel介绍 介绍 alibaba/Sentinel Wiki GitHub 1、Sentinel是什么 随着微服务的流行,服务和服务之间的稳定性变得越来越重要。Sentinel以流量为切入点,从流量控制、熔断降级、系统负载保护等多个维度保护服务的稳定性。 Sentinel 具有以下特征&a…

集合详解-迭代器遍历-增强for-List集合-List五种遍历方式-Set集合-排序规则Comparable-双列集合

Collection集合 数组和集合的区别 相同点 都是容器,可以存储多个数据 不同点 数组的长度是不可变的,集合的长度是可变的 数组可以存基本数据类型和引用数据类型 集合只能存引用数据类型,如果要存基本数据类型,需要存对应的包装类 Collection 集合概述和使用 Collection…

安全评估与安全评价:区分核心概念

在当今信息化社会中,保护数据和网络安全变得尤为重要。为了确保系统和组织的安全,我们需要了解并正确运用安全评估和安全评价这两个核心概念。虽然它们听起来相似,但其实它们有着不同的定义和目的。 首先,安全评估是一种系统性的…

【Github】如何在Github上找到zotero插件的下载位置

最近博主在使用zotero时需要从github上下载一个插件,通过链接跳转到Github对应的用户下,可是还是花了一些时间才找到插件的具体位置,这里将我的经历分享给大家。 1、跳转到Github对应的用户下。 博主需要下载zotero中的中文文献识别插件Jas…

Adobe Acrobat DC中如何合并pdf并生成目录

一、利用 Acrobat 合成pdf目录 (一)新建标签(更改标签等级等) 1,用Adobe acrobat 软件打开待添加书签的pdf文档。 2,打开之后点击软件左边栏的书签(有时被隐藏了,点击一下界面左边…

通过elementUI学习vue

<template><el-radio v-model"radio" label"1">备选项</el-radio><el-radio v-model"radio" label"2">备选项</el-radio> </template><script>export default {data () {return {radio: 1}…

Phoncent博客:探索AI写作与编程的无限可能

Phoncent博客&#xff0c;一个名为Phoncent的创新AIGC博客网站&#xff0c;于2023年诞生。它的创始人是庄泽峰&#xff0c;一个自媒体人和个人站长&#xff0c;他在网络营销推广领域有着丰富的经验。庄泽峰深知人工智能技术在内容创作和编程领域的潜力和创造力&#xff0c;因此…

【全志D1-H 哪吒开发板】Debian系统安装调教和点灯指南

全志D1-H开发板【哪吒】使用Deabian系统入门 特别说明&#xff1a; 因为涉及到操作较多&#xff0c;博文可能会导致格式丢失 其中内容&#xff0c;会根据后续使用做优化调整 目录&#xff1a; 参考资料固件烧录启动调教点灯问题 〇、参考资料 官方资料 开发板-D1开发板【…

面试笔记系列六之redis+kafka+zookeeper基础知识点整理及常见面试题

Redis redis持久化机制&#xff1a;RDB和AOF Redis 持久化 Redis 提供了不同级别的持久化方式: RDB持久化方式能够在指定的时间间隔能对你的数据进行快照存储. AOF持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF命令以redi…

如何在aws服务器上部署mysql

在AWS服务器上部署 MySQL 数据库可以通过以下步骤完成&#xff1a; 启动 EC2 实例&#xff1a; 在 AWS 控制台中启动一个 EC2 实例&#xff0c;选择适合你需求的实例类型和配置。 安全组配置&#xff1a; 确保你的 EC2 实例的安全组配置允许来自你的 IP 地址的 MySQL 连接。默…

iOS中卡顿产生的主要原因及优化思路

卡顿本质上是一个UI体验上的问题&#xff0c;而UI的渲染及显示&#xff0c;主要涉及CPU和GPU两个层面。若 CPUGPU渲染耗时超过16.7ms&#xff0c;就会在屏幕vsync信号到来时无法更新屏幕内容&#xff0c;进而导致卡顿。 iOS中UI渲染主要包含Layout->Draw->Prepare->Co…