常用ai模型和一些术语的科普

本文是早年浏览easyai.tech后留下的笔记。

文章目录

  • 神经网络
  • CNN
  • RNN
  • GAN
  • KNN
  • CPU和GPU/TPU
  • NLP
  • No free lunch theorem
  • transformer
  • 注意力机制
  • 自动编码器,自编码器
  • GNN
  • 推荐系统
  • 附录
    • NFL的两个例子

神经网络

水流,水龙头,流量阀。
可以回想CNN分类MNIST识别手写数字的例子。最后看哪个输出水龙头流出来的水最多。

深度学习的特征提取并不依靠人工,而是机器自动提取的。可解释性差。

CNN

适合处理图像。
卷积层,保留图片的特征
池化层,把数据降维,避免过拟合
全连接层,主体工作

RNN

适合处理序列。
RNN只有短期记忆。LSTM有长期记忆,记住“重要”内容。

GAN

生成对抗网络。基本思想是在攻防中提升。

KNN

k nearest neighbor,此nn非彼nn。既可以用来分类(多数表决),也可以用来回归(取邻居均值)。
训练时间为0,但分类时计算量较大,需要计算target跟训练集每个点的距离。

CPU和GPU/TPU

一个教授和一百个小学生的区别。
TPU的T是tensor。

NLP

nlp分为nlu理解和nlg生成。
nlu的用途,机器翻译,聊天机器人(人工客服)。
nlg的用途,新闻自动生成,聊天机器人(人工客服),BI(business intelligence)报告。

No free lunch theorem

没有一个算法能在所有情况下最佳。
其实我们的初心是超越“乱猜”。只有一种办法能做到,就是依靠先验知识。
这个知识是场景相关的。有的场景中,知识是对的,另一些场景中,知识是错的。

transformer

bert和gpt-2的效果非常好,在语义特征提取能力、长距离特征捕获能力、任务综合特征抽取能力、并行计算能力及运算效率全方面超越了cnn和rnn及其变体。
这里的t,就是transformer。

注意力机制

注意力机制如今已经被广泛地应用到了基于序列的任务中,它的优点是能够放大数据中最重要的部分的影响。

自动编码器,自编码器

自动编码器是神经网络的一种,其基本思想就是直接使用一层或者多层的神经网络对输入数据进行映射,得到输出向量,作为从输入数据提取出的特征。传统的自动编码器一般用来数据降维或者特征学习,类似于PCA,但是自动编码器比PCA灵活的多,因为它既能表征线性变换又能表征非线性变换。
自编码器待填坑。

GNN

图是不规则的,图中的每个节点都有不同数量的相邻节点。因此平时的卷积就不合适了。
图中节点相关,而不是像假设一样独立。
因此需要针对性设计出图神经网络。
图神经网络可以分为五类,分别是:图卷积网络(Graph Convolution Networks,GCN)、 图注意力网络(Graph Attention Networks)、图自编码器( Graph Autoencoders)、图生成网络( Graph Generative Networks) 和图时空网络(Graph Spatial-temporal Networks)。其中,图卷积网络是基础。

推荐系统

推荐系统的本质是数据补全。

附录

NFL的两个例子

Posit a toy universe that exists for exactly two days and on each day contains exactly
one object, a square or a triangle. The universe has exactly four possible histories:

(square, triangle): the universe contains a square on day 1, and a triangle on day 2
(square, square)
(triangle, triangle)
(triangle, square)
Any prediction strategy that succeeds for history #2, by predicting a square on day 2
if there is a square on day 1, will fail on history #1, and vice versa. If all histories
are equally likely, then any prediction strategy will score the same, with the same
accuracy rate of 0.5.

另一个例子是下面两张图。先验知识是,“只要向上爬,就能到最高点”。这个知识在图一会成功,在图二就会失败。
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/676548.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

StretchSense:将手部动作无缝集成到Xsens全身动捕系统中

在动画制作中逼真的手部动作可以大幅提升角色的情感表现能力,这将使观众更加轻易的走进角色,感受角色的情感变化并更加快速的了解角色的性格特点。如性格外向的角色将拥有更加复杂的手部动作表达。因此有效加强角色的手部动画真实度有助于吸引更多的观众…

基于Java+Vue智慧社区管理系统设计和实现(源码+LW+调试文档+讲解等)

💗博主介绍:✌全网粉丝1W,CSDN作者、博客专家、全栈领域优质创作者,博客之星、平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌💗 🌟文末获取源码数据库🌟 感兴趣的可以先收藏起来,还…

22-验证码的处理

验证码这种问题是比较头疼的,对于验证码的处理,不要去想破解方法,这个验证码本来就是为了防止别人自动化登录的。 目前最快速解决的三个手段: 去掉验证码:比较适合新开发但未上线的系统。设置万能码:比较适…

【GD32】06 - SPI (含ST7735S TFT-LCD屏幕驱动)

这篇文章我们看看GD32中如何实现SPI,软件SPI的话可以参考我之前的文章,把对应操作GPIO口的代码从STM32改成GD32就可以使用了。 【快速上手STM32】SPI通信协议&&1.8寸TFT-LCD(ST7735S)_tftlcdst7735和stm32-CSDN博客文章浏…

docker部署skywalking

skywalking版本下载 1:拉取skywalking的oap镜像(可以选择自己的版本,最好与ui,agent版本一致) docker pull apache/skywalking-oap-server:9.5.02:启动oap docker run -d -p 11800:11800 -p 12800:12800 --name sw_oap apache/…

HCIE数通,为啥是网工的“黄金标准”?

作为网络工程师,你不可能没听说过HCIE,也不可能没听过数通,也可能曾经考虑过要不要挑战这个认证。 HCIE数通为何被誉为网工的黄金标准?聊聊 01 什么是HCIE数通? HCIE数通认证是华为技术有限公司推出的一项高级别认证…

深度学习-05-反向传播理论知识

深度学习-05-反向传播理论知识 本文是《深度学习入门2-自製框架》 的学习笔记,记录自己学习心得,以及对重点知识的理解。如果内容对你有帮助,请支持正版,去购买正版书籍,支持正版书籍不仅是尊重作者的辛勤劳动&#xf…

使用 IPSET 添加 CDN 节点 IP(IPv4/IPv6)到防火墙白名单

明月的服务器一直使用的是 iptables,随着近几年 IPv6 的普及,明月切身体会到还是 IPSET 最方便了,无论你是 IPv4 还是 IPv6 都可以方便的管理,无论你是加入白名单还是黑名单,都非常的简单高效!今天就参照明月自己的实操…

PyQt5串口测试工具

笔者经常会遇到使用上位机进行相关测试的场景,但现成的上位机并不能完全满足自己的需求,或是上位机缺乏使用说明。所以,自己写? 环境说明 pycharm 2023.2.25 python 3.10 anaconda 环境配置 conda create -n envsram ##…

Proxmox Backup Server 命名空间使用

作者:田逸(formyz) Proxmox Backup Server(一下统称PBS)从2.2版本开始,新增了命名空间这样一个功能。这个功能大大便利了多Proxmox VE集群或者单节点备份,在以前PBS版本中,如果有多个…

Windows系统下DOS命令

Windows系统下DOS命令 1. 与文件操作相关1.1 mkdir,md命令1.2 rmdir、rd命令1.3 dir命令1.4 start命令1.5 echo命令1.6 type命令1.7 copy命令1.8 move命令1.9 copy和move的区别1.10 del命令1.11 rename命令1.12 attrib命令1.13 fsutil命令1.14 assoc命令 2. 与网络相…

DevOps生命周期的8个阶段和DevOps pipeline 详解

您可能也在探索DevOps pipeline或工作流的概念,这些术语可能会根据不同的解释者而有所交替使用。尽管如此,DevOps生命周期和DevOps pipeline这两个术语更常被提及。 本文将首先阐述DevOps生命周期的概念,然后深入介绍DevOps pipeline。 Dev…

基于4G工业路由器的信息发布系统物联网应用方案

随着物联网技术的快速发展,智能信息发布系统已成为城市管理和信息传播的重要工具。而4G工业路由器作为连接信息发布终端与云平台的关键设备,其在提升信息发布效率方面发挥着至关重要的作用。为了提升智能信息发布系统的效率和智能化水平,智联…

怎么在pdf上编辑文字?帮你解决这个头疼的问题!

在信息爆炸的时代,PDF作为一种通用性极强的文件格式,广泛应用于各个领域。然而,对于许多用户来说,如何在PDF上编辑文字却是一个令人头疼的问题。今天,我们就来聊聊这个话题,并为大家推荐几款实用的PDF编辑软…

Python程序设计 身份证号的奥秘

第1关:判断性别 通过身份证的第17位也就是倒数第二位的数字可以辨别该身份证所属人的性别,奇数为男性,偶数为女性。 任务:输入身份证号,第17位若是偶数,输出男性,否则输出女性 如何截取字符串的一个字符 如何判断一个…

【YOLO 系列】基于YOLO V8的河道违规钓鱼检测识别系统【python源码+Pyqt5界面+数据集+训练代码】

前言: 随着社会发展和人口增长,对自然资源的保护和管理变得越来越重要。河流是重要的自然资源之一,对生态系统和人类社会都至关重要。然而,违规钓鱼等活动可能对河流生态环境造成严重破坏,并影响水域资源的可持续利用…

Codeforces Round 920 (Div. 3) E. Eat the Chip 题解 博弈论 贪心

Eat the Chip 题目描述 Alice and Bob are playing a game on a checkered board. The board has h h h rows, numbered from top to bottom, and w w w columns, numbered from left to right. Both players have a chip each. Initially, Alice’s chip is located at th…

回溯--字母迷宫

1.题目描述 字母迷宫游戏初始界面记作 m x n 二维字符串数组 grid,请判断玩家是否能在 grid 中找到目标单词 target。 注意:寻找单词时 必须 按照字母顺序,通过水平或垂直方向相邻的单元格内的字母构成,同时,同一个单…

SSM民宿在线预订平台的设计与实现-计算机毕业设计源码44449

摘 要 信息化社会内需要与之径,但是途径的扩展基本上为人们所努力的方向,由于站在的角度存在偏差,人们经常能够获得不同类型信息,这也是技术最为难以攻克的课题。针对民宿在线预订平台等问题,对民宿信息管理进行研究分…

【Qt知识】Qt窗口坐标系

Qt的窗口坐标体系遵循标准的计算机图形坐标系统规则 Qt窗口坐标体系特点 坐标原点:窗口坐标体系的原点位于窗口的左上角,即坐标(0, 0)位置。 轴方向: X轴:向右为正方向,随着X坐标值的增加,元素在窗口中从…