人工智能-机器学习-深度学习-分类与算法梳理

人工智能-机器学习-深度学习-分类与算法梳理

目前人工智能的概念层出不穷,容易搞混,理清脉络,有益新知识入脑。

为便于梳理,本文只有提纲,且笔者准备仓促,敬请勘误,不甚感激。
请看右边目录索引

人工智能

三大派系

符号主义(Symbolists) 基于逻辑推理的智能模拟方法。最喜欢的算法是:规则和决策树。符号主义的代表性成果有启发式程序、专家系统、知识工程等,IBM“深蓝”计算机为典型应用。

连接主义(Connectionist) 使用概率矩阵和加权神经元来动态地识别和归纳模式,奠基人是明斯基(MIT),发展最火是深度学习,深度神经网络,ChatGPT为典型应用。

行为主义(actionism) 其原理为控制论及感知-动作型控制系统。擅长于使用遗传算法(Genetic Algorithm,GA)和遗传编程。行为主义的代表性成果有六足行走机器人、波士顿动力机器人等。

还有五派分法,笔者本人未弄清内部逻辑,感觉无法和本文的体系融体,未列出。

三大分支

  • 认知AI(cognitive AI)
  • 机器学习(Machine Learning AI)
  • 深度学习(Deep Learning) : 是一种特殊的机器学习。

image.png

2016年Alpha Go打败了李世石,确立了深度学习正在机器学习领域中的霸主地位

核心技术与领域

  • 机器学习(Machine learning)
  • 深度学习(Deep learning)
  • 计算机视觉(Computer Vision) 图像识别、目标检测、图像分割、人脸识别等技;模型有CNN、FCN、RCNN 等
  • 自然语言处理(Natural Language Processing, NLP) 语音识别、文本分类、信息抽取、机器翻译等多个方面,模型RNN、LSTM、transformer等
  • 自动规划和决策:自动规划和决策涉及开发能够自主感知环境并作出决策的算法和系统,它可以应用于无人驾驶汽车、物流规划、智能机器人等领域

还有诸如:机器人、专家系统、智能搜索、自动程序设计等

四大要素

  • 数据
  • 算力
  • 算法
  • 应用

机器学习

问题分类

  • 有监督学习(Supervised Learning): 分类、回归
  • 无监督学习(Unsupervised Learning):聚类、维降、关联
  • 强化学习(Reinforcement Learning)

监督学习常见算法

  1. 朴素贝叶斯
  2. 决策树
  3. 支持向量机
  4. 逻辑回归
  5. 线性回归
  6. k近邻
  7. AdaBoost
  8. 神经网络

前4解决分类问题,第5用于回归问题, 后3个解决分类回归问题

非监督学习算法

  1. K-means(K-均值)
  2. Birch(综合层次聚类)
  3. Dbscan(基于密度聚类)
  4. String(字符串聚类)
  5. PCA(Principal Component Analysis 主要成分分析)
  6. LDA(Linear Discriminate Analysis 线性判别分析)
  7. LLE(Locally linear embedding 局线性判别分析部线性嵌入)
  8. LE(Laplacian Eigenmaps 拉普拉斯映射)

前4为聚类算法,后4个为降维算法

强化学习

强化学习用以描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。

基本模型

image.png

  • 智能体(agent): 学习的本体,即学习者或者决策者
  • 环境(environment): 智能体以外的一切,主要由状态集合组成
  • 状态(state): 表示环境的数据
  • 动作(action): 智能体可做出的动作
  • 奖励(reward): 智能体在执行一个动作后,获得的正/负反馈信号

现在正当时的Q-Learning就是强化学习的一种

深度学习

基础知识

  • 正向传播
  • 反向传播
  • 梯度计算
  • 损失函数
  • 激活函数:sigmoid、tanh、ReLu、SoftMax

深度算法

  • 卷积神经网络(Convolutional Neural Networks,CNN)
  • 递分子循环)神经网络(Recurrent Neural Networks,RNN)
  • 长短时记忆网络(Long Short-Term Memory,LSTM)
  • 生成对抗网络(Generative Adversarial Networks,GAN)
  • 可变自编码器(Variational Autoencoders,VAE)
  • 深度强化学习(Deep Reinforcement Learning,DRL)
  • 深度信念网络(Deep Belief Networks,DBN)
  • 自编码器(Autoencoders AE)
  • 迁移学习(Transfer Learning)
  • 残差网络(ResNet)
  • 注意力机制(Attention)

机器学习、深度学习、强化学习三者交叉关系

  • 机器学习:所有以优化方法挖掘数据中规律的学科
  • 深度学习:运用了神经网络作为参数结构进行优化的机器学习算法
  • 强化学习:不仅利用现有数据还对环境的探索获得新数据,并利用新数据循环往复地更新迭代现有模型
  • 深度强化学习:运用了神经网络作为参数结构进行优化的强化学习算法。

AI大模型

大模型指的是在训练阶段和推理阶段需要大量参数和计算资源的深度学习模型。

特点

  • 大量的参数
  • 上下文理解和生成
  • 强大的泛化能力
  • 计算资源需求大
  • 迁移学习能力
  • 预训练与微调
  • 多领域应用

所处位置

image.png

按工作方式分类

  • 强化学习模型(Reinforcement Learning Models)
  • 生成模型(Generative Models)

按数据类型分类

  • 语言模型(Language Models)
  • 图像模型(Image Models)
  • 多模态大模型(Multimodal Models)

主流AI大模型

  • OpenAI GPT大模型组
  • Google PaLM & PaLM 2大模型组
  • 百度文心大模型组
  • 讯飞星火认知大模型
  • 阿里通义大模型
  • 清华开源大模型ChatGLM
  • Llama2
  • Baichuan

未来趋势

  • 通用大模型与专用小模型协同发展
  • 模型即服务将不断成为主流(MaaS)
  • 拥有算力、模型、平台和产品经验的科技公司成为重要参与者

[参考]

  • zhuanlan.zhihu.com/p/485787394
  • zhuanlan.zhihu.com/p/652579528
  • baijiahao.baidu.com/s?id=178154…
  • baijiahao.baidu.com/s?id=177661…

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/335936.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

动态规划Day14(子序列第二天)

目录 1143.最长公共子序列 看到题目的第一想法 看到代码随想录之后的想法 自己实现过程中遇到的困难 1035.不相交的线 看到题目的第一想法 看到代码随想录之后的想法 自己实现过程中遇到的困难 53. 最大子序和 看到题目的第一想法 …

网络编程01 常见名词的一些解释

本文将讲解网络编程的一些常见名词以及含义 在这之前让我们先唠一唠网络的产生吧,其实网络的产生也拯救了全世界 网络发展史 网络的产生是在美苏争霸的期间,实际上双方都持有核武器,希望把对方搞垮的同时不希望自己和对方两败俱伤. 希望破坏对方的核武器发射,这就涉及到三个方面…

【Vue】vue项目中Uncaught runtime errors:怎样关闭

vue项目中Uncaught runtime errors:怎样关闭 一、背景描述二、报错原因三、解决方案3.1 只显示错误信息不全屏覆盖3.2 取消全屏覆盖 四、参考资料 一、背景描述 项目本来运行的好好,换了个新的浏览器,新的Chrome浏览器版本号是116.0.5845.97&#xff08…

【Linux】Linux进程间通信(四)

​ ​📝个人主页:Sherry的成长之路 🏠学习社区:Sherry的成长之路(个人社区) 📖专栏链接:Linux 🎯长路漫漫浩浩,万事皆有期待 上一篇博客:【Linux】…

flask分页宏增加更多参数

背景:我正在开发一个博客,核心的两个model是文章和文章类别。 现在想要实现的功能是:点击一个文章类别,以分页的形式显示这个文章类别下的所有文章,类似这种效果。 参考的书中分页宏只接受页数这一个参数,…

NLP论文阅读记录 - 2021 | WOS MAPGN:用于序列到序列预训练的掩码指针生成器网络

文章目录 前言0、论文摘要一、Introduction1.1目标问题1.2相关的尝试1.3本文贡献 二.前提三.本文方法四 实验效果4.1数据集4.2 对比模型4.3实施细节4.4评估指标4.5 实验结果4.6 细粒度分析 五 总结思考 前言 MAPGN: MASKED POINTER-GENERATOR NETWORK FOR SEQUENCE-TO-SEQUENCE…

python常用库

常见模块解析 1. math库 数学函数 函数返回值 ( 描述 )abs(x)返回数字的绝对值&#xff0c;如abs(-10) 返回 10ceil(x)返回数字的上入整数&#xff0c;如math.ceil(4.1) 返回 5cmp(x, y)如果 x < y 返回 -1, 如果 x y 返回 0, 如果 x > y 返回 1。 **Python 3 已废弃…

Pandas.DataFrame.groupby() 数据分组(数据透视、分类汇总) 详解 含代码 含测试数据集 随Pandas版本持续更新

关于Pandas版本&#xff1a; 本文基于 pandas2.1.2 编写。 关于本文内容更新&#xff1a; 随着pandas的stable版本更迭&#xff0c;本文持续更新&#xff0c;不断完善补充。 Pandas稳定版更新及变动内容整合专题&#xff1a; Pandas稳定版更新及变动迭持续更新。 Pandas API参…

jquery动态引入js和css

直接上代码吧&#xff0c;但是有时候这个方法会失败&#xff0c;js文件里面的方法不生效&#xff0c;原因还在找 // 动态引入cssvar cssFileUrl index.css;$("head").append("<link>");css $("head").children(":last");css.a…

Codeforces Round 803 (Div. 2) E. PermutationForces II(思维题 位置序列)

题目 给定长为n(n<2e5)的两个序列a和b&#xff0c; a为n的一个排列&#xff0c; b也为n的一个排列&#xff0c;但有一些位置被-1替换了&#xff0c;保证没被替换的位置在[1,n]之间且两两不同 你有一个距离最大限制s&#xff0c;你可以执行n次操作&#xff0c; 第i次操作…

【现代密码学基础】详解完美安全与不可区分安全

目录 一. 介绍 二. 不可区分性试验 三. 不可区分性与完美安全 四. 例题 五. 小结 一. 介绍 敌手完美不可区分&#xff0c;英文写做perfect adversarial indistinguishability&#xff0c;其中adversarial经常被省略不写&#xff0c;在密码学的论文中经常被简称为IND安全。…

视频增强修复Topaz Video AI

Topaz Video AI是一款强大的视频增强软件&#xff0c;利用人工智能技术对数千个视频进行训练&#xff0c;结合多个输入视频的帧信息来提高素材的分辨率。该软件可将视频的分辨率提高到最高8K&#xff0c;并保持真实的细节和运动一致性。同时&#xff0c;它还能自动修复视频中的…

Linux系统CPU持续飙高,如何排查?

一、检查CPU使用率 首先在Linux系统中检查CPU使用率。可以通过在命令行中输入top或htop命令来查看当前系统中各个进程的CPU使用率。如果CPU使用率大于80%&#xff0c;则可以考虑进行排查。 $ top 二、检查系统负载 另外可以使用uptime命令来查看系统的平均负载情况。 $ upti…

DiffMIC:融合局部和全局分析,基于扩散模型的医学图像分类方法

DiffMIC&#xff1a;基于扩散模型的医学图像分类方法 DiffMIC的核心思想糖尿病视网膜病变分级 网络结构去噪扩散模型&#xff1a;提升特征清晰度双粒度条件引导&#xff08;DCG&#xff09;&#xff1a;融合局部和全局分析条件特定的最大均值差异&#xff08;MMD&#xff09;正…

【Java】JDBC练习

JDBC练习 环境准备 -- 删除tb_brand表 drop table if exists tb_brand; -- 创建tb_brand表 create table tb_brand (-- id 主键id int primary key auto_increment,-- 品牌名称brand_name varchar(20),-- 企业名称company_name varchar(20),-- 排序字段ordered …

C++设计模式之 模板方法模式

【声明】本题目来源于卡码网&#xff08;题目页面 (kamacoder.com)&#xff09; 【提示&#xff1a;如果不想看文字介绍&#xff0c;可以直接跳转到C编码部分】 【设计模式大纲】 【简介】 --什么是模板方法模式&#xff08;第18种设计模式&#xff09; 模板方法模式&#xff0…

《Linux高性能服务器编程》笔记02

Linux高性能服务器编程 参考 Linux高性能服务器编程源码: https://github.com/raichen/LinuxServerCodes 豆瓣: Linux高性能服务器编程 文章目录 Linux高性能服务器编程第06章 高级I/O函数6.1 pipe函数6.2 dup函数和dup2函数6.3 readv 函数和writev 函数6.4 sendfile 函数6.…

基于SSM的KTV包厢管理系统(有报告)。Javaee项目,ssm项目。

演示视频&#xff1a; 基于SSM的KTV包厢管理系统&#xff08;有报告&#xff09;。Javaee项目&#xff0c;ssm项目。 项目介绍&#xff1a; 采用M&#xff08;model&#xff09;V&#xff08;view&#xff09;C&#xff08;controller&#xff09;三层体系结构&#xff0c;通过…

软件测试|sqlalchemy一对一关系详解

简介 SQLAlchemy 是一个强大的 Python ORM&#xff08;对象关系映射&#xff09;库&#xff0c;它允许我们将数据库表映射到 Python 对象&#xff0c;并提供了丰富的关系模型来处理不同类型的关系&#xff0c;包括一对一关系。在本文中&#xff0c;我们将深入探讨 SQLAlchemy …

后台管理系统: 数据可视化基础

数据可视化简单理解&#xff0c;就是将数据转换成易于人员辨识和理解的视觉表现形式&#xff0c;如各种 2D 图表、3D 图表、地图、矢量图等等。 例如Excel等等 canvas <canvas> 标签只是图形容器&#xff0c;相当于一个画布&#xff0c;canvas 元素本身是没有绘图能力…