机器学习之朴素贝叶斯

目录

前言

1、核心思想

2、应用领域

一、数学基础

二、贝叶斯

三、朴素贝叶斯

1、定义

2、拉普拉斯平滑系数

四、API

1、API

2、案例

五、总结


 

前言

        朴素贝叶斯(Naive Bayes)是一种基于贝叶斯定理特征条件独立性假设的常见的机器学习分类算法。这种方法的名称中的“朴素”一词,源于其对特征之间独立性的简化假设,即假设所有特征之间相互独立,互不影响。尽管在实际问题中这种完全独立的情况并不多见,但这种假设恰恰使得朴素贝叶斯在面对高维度数据时依然能够保持快速且相对准确的分类能力。

1、核心思想

        朴素贝叶斯的核心思想是在给定一组特征的情况下,计算各个类别出现的可能性,然后选择可能性最大的类别作为预测结果。其关键之处在于“朴素”假设,即将复杂的多维条件概率简化为单个特征的条件概率的乘积。

2、应用领域

        朴素贝叶斯分类器在文本分类、垃圾邮件过滤、情感分析、文档分类等文本相关的问题中得到了广泛应用,同时也适用于医学诊断、金融欺诈检测等领域。它的优点包括模型简单、易于实现、对缺失数据不敏感,但缺点是对特征的条件独立性有较强的假设,可能导致在某些情况下分类效果不佳。

 

 

一、数学基础

af8f01c0b2804dd4b4829a6d88a9711e.png

 

 

二、贝叶斯

26f3a40b43274d78bfee1b9ff8c5b77d.png

 

 

三、朴素贝叶斯

1、定义

f56fb47096a34ddfa60784de99981c20.png

2、拉普拉斯平滑系数

9696998114c14ca6973dbf7b2102fab7.png

 

 

四、API

1、API

80573940921241089e3d2e25c09a5abf.png

2、案例

(1)  流程

  • 1)获取数据

  • 2)数据基本处理

    • 2.1) 取出内容列,对数据进行分析

    • 2.2) 判定评判标准

    • 2.3) 选择停用词

    • 2.4) 把内容处理,转化成标准格式

    • 2.5) 统计词的个数

    • 2.6)准备训练集和测试集

  • 3)模型训练

  • 4)模型评估

(2)  数据展示

133b976a804b4d2980979009ad8416c1.png

(三)  代码实现

ef352ccf3bf04a52ad2b4837caf6638d.png

35cf9944aad84b57811a556124a5f4f0.png

 

五、总结

        总的来说,朴素贝叶斯是一种简单而有效的分类算法,特别适用于特征之间条件独立的情况,并且在数据量较小的情况下表现良好。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/650940.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Bug:Linux用户拥有r权限但无法打开文件【Linux权限体系】

Bug:Linux用户拥有r权限但无法打开文件【Linux权限体系】 0 问题描述&解决 问题描述: 通过go编写了一个程序,产生的/var/log/xx日志文件发现普通用户无权限打开 - 查看文件权限发现该文件所有者、所有者组、其他用户均有r权限 - 查看该日…

如何免费把微信视频号的视频下载下来?电脑手机都可使用

今天,我将为大家分享一个实用的技巧:如何免费将微信视频号的视频下载下来。 微信视频号作为一个流行的短视频平台,拥有大量优质内容。然而,由于平台政策限制,我们无法直接下载视频。不过,别担心&#xff0…

单点登录(JWT实现)

单点登陆的英文名是:Single Sign On(简称SSO),只需要登陆一次,就可以访问所有信任的应用系统。 在单体项目中,我们登陆之后可以把验证用户信息的值放入session中,单个tomcat中的session是可以共…

数字水印 | 离散余弦变换 DCT 基本原理及 Python 代码实现

目录 1 基本原理2 代码实现3 图像压缩 1 基本原理 参考博客:https://www.cnblogs.com/zxporz/p/16072580.html D C T \mathsf{DCT} DCT 全称为 D i s c r e t e C o s i n e T r a n s f o r m \mathsf{Discrete\ Cosine\ Transform} Discrete Cosine Transfo…

堆结构知识点复习——玩转堆结构

前言:堆算是一种相对简单的数据结构, 本篇文章将详细的讲解堆中的知识点, 包括那些我们第一次学习堆的时候容易忽略的内容, 本篇文章会作为重点详细提到。 本篇内容适合已经学完C语言数组和函数部分的友友们观看。 目录 什么是堆 建堆算法…

蓝桥杯2023(十四届)省赛——接龙数列(DP)

接龙数列(DP) 1.接龙数列 - 蓝桥云课 (lanqiao.cn) 琢磨半天,本来是开一个三维的,dp[i][j][k] 表示 前i个,以j为首项,k为尾项的最大子集个数,但是实际上用二维即可。想求的是删除个数&#xf…

java并发工具类都有哪些

Java中的并发工具类包括: CountDownLatch CountDownLatch允许一个或多个线程等待其他线程完成某些操作。它通常用于线程间的同步,例如在一个线程完成其工作后通知其他线程继续执行。 CyclicBarrier CyclicBarrier是一个同步辅助类,它允许一…

STM32H743+USBHID+CubeMX配置

一、环境准备 电脑系统:Windows 10 专业版 20H2 IDE:Keil v5.35、STM32CubeMX v6.5.0 测试硬件:正点原子阿波罗STM32H743 二、测试步骤 1、使用用例工程 配置STM32H743定时器功能-CSDN博客https://blog.csdn.net/horse_2007s/article/d…

基于51单片机的电压表-数码管显示

一.硬件方案 本设计基于STC89C52单片机的一种电压测量电路,该电路采用ADC0832A/D转换芯片,实现数字电压表的硬件电路与软件设计。该系统的数字电压表电路简单, 可以测量0~9V的电压值,并在四位LED数码管上显示电压值。 二.设计功能 (1&…

HNCTF

HNCTF 文章目录 HNCTFBabyPQEZmathez_Classicf(?*?)MatrixRSABabyAESIs this Iso? BabyPQ nc签到题,跟端口连接拿到n和phin n 8336450100232098099043686671148282601664696810002345240872579498695511770993195704402414029892029461830476866385453475141207…

211大学计算机专业不考408,新增的交叉专业却考408!南京农业大学计算机考研考情分析!

南京农业大学信息科技学院可追溯至1981年成立的计算中心和1985年筹建的农业图书情报专业。1987年设立了农业图书情报系,1993 年农业图书情报系更名为信息管理系,本科专业名称也于1999年更名为信息管理与信息系统专业。1994年计算中心开始招收计算机应用专…

SpringBootTest测试框架四

dubbo调用mock 同理,为了实现dubbo的mock,也是要在dubbo调用的过程中添加拦截器 dubbo原始的执行拦截器 Proxy.getProxy(interfaces).newInstance(new InvokerInvocationHandler(invoker)) 这里代码写死了,没办法了,只能将整个JavassistProxyFactory 替换掉 public class J…

Nvidia Orin/Jetson +GMSL/RLINC/VbyOne/FPDLink 同轴AI多相机同步车载视觉解决方案

在本次演讲中,介绍了多相机同步技术在自主机器中的应用情况,围绕无人配送小车、控制器视觉传感器方案升级、人形机器人三个典型案例中如何为客户提供高效的多相机同步解决方案进行了详细的讲解,并进一步介绍如何通过创新的多相机同步技术&…

Facebook的心灵之镜:探寻数字社交的灵魂深处

在当今数字化时代,社交媒体已经成为了人们生活的一部分,而Facebook作为其中的佼佼者,更是承载了数以亿计的用户情感和交流。然而,Facebook不仅仅是一个简单的社交平台,它更像是一面心灵之镜,反映着数字社交…

TS(TypeScript)中Array数组无法调出使用includes方法,显示红色警告

解决方法 打开tsconfig.json文件,添加"lib": ["es7", "dom"]即可。 如下图所示。

基于Qt的网上购物系统的设计与实现

企鹅:2583550535 代码和论文都有 第1章 绪论... 1 1.1 项目背景... 1 1.2 国内外研究现状... 1 1.3 项目开发意义... 3 1.4 报告主要内容... 3 第2章 关键技术介绍... 4 2.1 后端开发技术... 4 2.1.1 C. 4 2.1.2 Qt框架... 4 2.1.3 MySQL数据库... 5 2.2 …

Java开发大厂面试第20讲:什么是分布式锁?Redi 怎样实现的分布式锁?

“锁”是我们实际工作和面试中无法避开的话题之一,正确使用锁可以保证高并发环境下程序的正确执行,也就是说只有使用锁才能保证多人同时访问时程序不会出现问题。 我们本课时的面试题是,什么是分布式锁?如何实现分布式锁&#xf…

DSP开发入门

视频: 创龙TI 最新DSP CPU核心架构 C66x 以及 KeyStone I 架构 DSP TMS320C6655/57以及TMS320C6678视频教程全集_哔哩哔哩_bilibili 2024年硬汉科技手把手教您学DSP28335视频教程持续更新中_哔哩哔哩_bilibili DSP芯片介绍 DSP选型 TI的DSP 分为三大系列&#…

comfyui电商场景工作流总结

eSheep(内测中) - 一站式的AIGC社区eSheep.com 是国内知名的AIGC在线画图网站,提供海量模型,并支持在线AI画图。用户会上传自己的AIGC作品到网站上,进行交流。eSheep让AIGC更轻松,让更多人在AIGC中找到快乐https://www.esheep.com/apphttps://openart.ai/workflows/all

单链表OJ题(课堂总结)

1.链表的带环问题 上图就是一个典型的带环链表 1.1如何判读链表是否带环? 最常见的方法就是利用快慢指针,快指针追加慢指针,当二者相等的时候即可判断链表带环 其实现的代码如下: bool hasCycle(struct ListNode*head) { s…