朴素贝叶斯算法基础——案例:对新闻进行分类

贝叶斯公式
贝叶斯公式

朴素:假设特征与特征之间相互独立

朴素贝叶斯算法:朴素+贝叶斯

应用场景:文本分类(单词作为特征)

拉普拉斯平滑系数
拉普拉斯平滑系数
Ni:F1词在C类别所有文档中出现的次数
N:所属类别C下的文档所有词出现的次数和
a:指定的系数一般为1
m:训练文档中统计出的特征词个数

不懂没关系,会用API就行!!!!!

API:
sklearn.naive_bayes.MultinomialNB(alpha = 1.0)

  • 朴素贝叶斯分类
  • alpha:拉普拉斯平滑系数

案例:
1、获取数据
2、划分数据集
3、特征工程——文本特征抽取
4、朴素贝叶斯算法的
5、模型评估

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import GridSearchCV
from sklearn.datasets import fetch_20newsgroups
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.naive_bayes import MultinomialNB

#用朴素贝叶斯算法对新闻进行分类
#获取数据
news = fetch_20newsgroups(subset = 'all')
#数据集划分
x_train,x_test,y_train,y_test = train_test_split(news.data,news.target)
print(x_train)
#特征工程——文本特征抽取
transfer = TfidfVectorizer()
x_train = transfer.fit_transform(x_train)
x_test = transfer.transform(x_test)

#朴素贝叶斯算法预估器流程
estimator = MultinomialNB()
estimator.fit(x_train,y_train)
#模型评估
#方法一:直接比对真实值和预测值
y_predict = estimator.predict(x_test)
print("y_predict:\n",y_predict)
print("对真实值和预测值:\n",y_test == y_predict)
#方法二:计算准确率
score = estimator.score(x_test,y_test)
print("准确值为:\n",score)

运行结果

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/453152.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C语言 指针(4) qsort函数

目录 前言 一、回调函数 二、qsort函数 2.1 使用qsort函数排序整型数据 2.2 使用qsort排序结构数据 三、qsort函数的模拟实现 总结 前言 今天我们主要来学习一下C语言中的qsort排序函数。 一、回调函数 回调函数就是⼀个通过函数指针调用的函数。 如果你把函数的指针&a…

PMP考试心得,与大家共勉

本人刚刚通过PMP考试,有一些自己的经历,写出来欢迎已经是PMP的兄弟们指正,希望能给正在PMP之路上奔跑的人们一些帮助。 其实很早就听说过PMP认证考试了,但是一直工作很忙没有时间来投入学习考试。因此一直拖到今年夏天才有时间参加…

使用公式在Excel中指定列值的变化实现自动间隔着色(不是按照固定的行数)

如果你的文件很小,可以手工着色;但如果很大,就要借助公式来着色; 目的是什么,其中之一是:提升可读性。 一起往下看吧!! 如果你想要根据Excel某列中值的变化来间隔着色,…

CSS 【详解】响应式布局(明天内容)

响应式布局: 同一页面在不同的屏幕上有不同的布局,即一套代码自适应不同的屏幕。 常用 单位: 像素(px):像素是最常用的长度单位,它表示屏幕上的一个物理像素点。例如,width: 200px; …

迪杰斯特拉算法 代码

参考链接: 【路径规划】全局路径规划算法——Dijkstra算法(含python实现 | c实现)-CSDN博客 算法图解: 代码 def dijkstra(matrix, source):"""迪杰斯特拉算法实现Args:matrix (_type_): 用邻接矩阵表示带权图s…

代码随想录算法训练营第六天| 242.有效字母的异位词、349.两个数组的交集、202快乐数、1.两数之和

系列文章目录 目录 系列文章目录242.有效的字母异位词349. 两个数组的交集①使用HashSet②使用Hash数组 202. 快乐数1. 两数之和①暴力解法(时间复杂度不符合要求)②使用HashMap法 242.有效的字母异位词 这道题是数组在哈希表中的典型应用。 因为只有2…

【C++】STL(七) set容器

8. set容器8.1 简介8.2 构造和赋值例子 8.3 大小和交换例子 8.4 插入和删除例子 8.5 查找和统计例子 8.6 set和multiset区别例子 8.7 pair对组创建 ----- 成对出现的数据,利用对组可以返回两个数据创建方式例子 8.8 内置类型指定排序规则(1) …

Powershell应用

Powershell应用 帮助命令进程管理服务管理文件管理网络管理系统管理用户管理远程管理常见问题 字符串和文本处理脚本和模块其他常用命令返回值类型PowerShell调用C# 类库PowerShell使用WmiWQL测试工具 帮助命令 Get-Help 这个命令用于获取其他命令的帮助文档,例如 …

像SpringBoot一样使用Flask - 3.蓝图路由Blueprint

接上一篇文章《像SpringBoot一样使用Flask - 2.静态资源访问及模版》,我们看到测试的"controller"都写在了一起🤔 如何像Springboot一样划分出一个完整的controller,里面实现不同业务的包呢? 本篇引入Blueprint&#xf…

Qt教程 — 1.1 Linux下安装Qt

目录 1 下载Qt 1.1 官方下载 1.2 百度网盘下载 1.3 Linux虚拟机终端下载 2 Qt安装 3 安装相关依赖 4 测试安装 1 下载Qt 1.1 官方下载 通过官网下载对应版本,本文选择的版本为qt-opensource-linux-x64-5.12.12,Qt官方下载链接:htt…

Liunx文件系统和基础IO

文件系统和基础IO 基础IOc语言基础IO函数当前路径和标准流系统IO系统调用函数重定向FILE文件结构体 在谈缓存区问题理解文件系统初识inode 基础IO c语言基础IO函数 打开与关闭 FILE *fopen(char *filename, const char *mode);选项还可以是 r/w/a 意味着为可读可写打开。 2…

【CSS】 css 实现文字的渐变色

效果 实现 .text {position: absolute;left: 52px;top: 1px;width: 200px;height: 31px;font-family: YouSheBiaoTiHei;font-size: 24px;color: rgba(255, 255, 255, 0.8);line-height: 31px;text-shadow: 0px 0px 8px #000000;text-align: center;font-style: normal;transiti…

车载气象站比传统气象站的优势是什么

【TH-CZ5】车载气象站在灵活性、覆盖范围、实时监测、多功能性和成本效益等方面均优于传统气象站。这些优势使得车载气象站在气象监测、气象服务、灾害应急等领域具有广泛的应用前景。 车载气象站与传统气象站相比,具有显著的优势,主要体现在以下几个方…

内网渗透-跨域环境渗透-2

目录 内网渗透-跨域环境渗透-2 热土豆提权 Wimc连接执行命令 Responder 密码抓取 WPAD提权 提取域控的NTDS hash文件 内网渗透-跨域环境渗透-2 热土豆提权 这个是提升本地权限的,不是提域控! 总结:Potato.exe -ip 需要提权的IP -disab…

Java+SpringBoot+Vue+MySQL:教育培训办公系统的全栈开发

✍✍计算机编程指导师 ⭐⭐个人介绍:自己非常喜欢研究技术问题!专业做Java、Python、微信小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目:有源码或者技术上的问题欢迎在评论区一起讨论交流! ⚡⚡ Java实战 |…

系统设计学习(二)用户认证场景

一、常用鉴权方式 HTTP Basic Authentication (HTTP基本认证) session-cookie 1,服务器在接受客户端首次访问时在服务器端创建session,然后保存session(我们可以将session保存在内存中,也可以保存在redis中,推荐使用后者)&…

Idea 看不到本地 change

环境 idea IntelliJ IDEA 2023.3.3 (Community Edition) idea 升级后,看不到本地change了,去掉下面勾选即可。 解决:

python调用clickhouse

(作者:陈玓玏) 使用clickhouse-driver包,先通过pip install clickhouse-driver安装包,再通过以下代码执行sql。 from clickhouse_driver import Client client Client(host10.43.234.214, port9000, userclickhou…

【网络安全】手机不幸被远程监控,该如何破解,如何预防?

手机如果不幸被远程监控了,用三招就可以轻松破解,再用三招可以防范于未然。 三招可破解可解除手机被远程监控 1、恢复出厂设置 这一招是手机解决软件故障和系统故障的终极大招。只要点了恢复出厂设置,你手机里后装的各种APP全部将灰飞烟灭…

AMEYA360:稳先微汽车驱动芯片—智能高边开关WS7系列

近几年,新能源汽车高速发展,用车浪潮蔓延全球,我国新能源汽车占有量连续9年居全球前列,2023年全年市占率达37.7%,市场规模可观,并显现出以下特点:电车产品对比油车优势明显、消费者接受度高、市…