【图书推荐】《机器学习实战(视频教学版)》

本书用处

快速入门Python机器学习基础算法。

最后3个综合实战项目(包括新闻内容分类实战、泰坦尼克号获救预测实战、中药数据分析项目实战)可以作为研究可以的素材。

内容简介

本书基于Python语言详细讲解机器学习算法及其应用,用于读者快速入门机器学习。本书配套示例源代码、PPT课件、教学视频、教学大纲、习题与答案、作者微信答疑。

本书共分12章,内容包括机器学习概述、Python数据处理基础、Python常用机器学习库、线性回归及应用、分类算法及应用、数据降维及应用、聚类算法及应用、关联规则挖掘算法及应用、协同过滤算法及应用,最后通过3个综合实战项目(包括新闻内容分类实战、泰坦尼克号获救预测实战、中药数据分析项目实战),帮助读者对所学技能进行巩固和提升。

本书主要章节都给出了对应的示例及其详细的分析步骤,方便读者从编程中掌握机器学习基础算法及应用。

适合读者

本书适合机器学习初学者,可以作为大数据分析和机器学习算法工程师的参考用书。

也可以作为高等院校或高职高专人工智能、大数据等专业的教材或教学参考书。

主要作者简介

迟殿委,计算机软件与理论专业硕士,系统架构设计师。有十多年JavaEE、大数据全栈应用开发经验和培训经验,擅长JavaEE架构设计、大数据分析与挖掘。著有图书:《Spark入门与大数据分析实战》《Hive入门与大数据分析实战》《Hadoop大数据分析技术》《Hadoop+Spark大数据分析实战》《Spring Boot企业级开发实战(视频教学版)》《深入浅出Java编程》《Spring Boot+Spring Cloud微服务开发》。

前言

随着技术的不断发展,人工智能和机器学习已经成为计算机领域中的重要分支,并且被广泛应用于工业、农业、商业、医学、艺术等各个领域。为了满足社会对相关人才的需求,急需提高IT技术人员对机器学习原理和算法的理解及应用能力。机器学习是一门多领域交叉学科,可以通过计算机模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构来改善自身性能。机器学习的应用是以大数据采集与处理为前提条件的。

本书内容

本书内容逻辑上分为编程基础、算法应用、项目实战三大部分。编程基础部分主要讲解Python编程基础、数据处理基础、机器学习常用库等内容,并讲解了机器学习分类、典型过程及常见应用。算法应用部分讲解如何建立大数据环境下的机器学习工程化思维,在不必深究算法细节的前提下,实现大数据分类、聚类、回归、协同过滤、关联规则、降维等算法及其应用。最后通过3个综合实战项目(新闻内容分类实战、泰坦尼克号获救预测实战、中药数据分析项目实战),帮助读者对所学技能进行巩固和提升。

本书特点

(1)本书针对每个经典算法基于机器学习典型开发流程展开,每个算法的讲解都采用先理论后应用实战的方法,方便读者从编程中学会机器学习算法及其应用。

(2)本书基于Python语言实现机器学习经典算法,步骤清晰简明,易于上手,重点放在机器学习算法理解和应用上。同时,本书配套了较为丰富的实战案例,并为案例提供了详细的步骤说明。

(3)本书尤其重视实践操作,包括框架搭建和开发环境安装、各种算法经典案例引入、算法原理讲解、综合项目实战提升等,并将实战与理论知识相结合,从而加深对机器学习算法的理解。

(4)本书作者是具有多年大数据分析和处理实战经验的高级工程师,算法讲解通俗易懂,方便读者提高学习效率,快速掌握机器学习技术。

配套资源下载

本书配套示例源代码、PPT课件、教学视频、教学大纲、习题与答案、作者微信答疑,读者需要用微信扫描下面的二维码获取。

本书读者

本书适合机器学习初学者,可以作为大数据分析和机器学习算法工程师的参考用书,也可以作为高等院校或高职高专人工智能、大数据等专业的教材或教学参考书。

编   者

2024年1月

目录
目    录
第1章  机器学习概述 1
1.1  机器学习简介 1
1.1.1  什么是机器学习 1
1.1.2  机器学习三要素和核心 2
1.1.3  机器学习开发流程 4
1.1.4  机器学习模型评价指标 7
1.1.5  机器学习项目开发步骤 10
1.2  机器学习的发展史和分类 11
1.2.1  机器学习的发展史 11
1.2.2  机器学习分类 16
1.3  机器学习常用术语 19
1.4  本章小结 27
第2章  Python数据处理基础 28
2.1  Python开发环境搭建 28
2.1.1  安装Python解释器 28
2.1.2  Python运行方法 30
2.1.3  安装PyCharm 31
2.1.4  Python包管理工具 35
2.1.5  安装Jupyter Notebook 36
2.2  Python基本数据类型 37
2.2.1  数值型 37
2.2.2  字符串(String) 39
2.2.3  列表(List) 41
2.2.4  元组(Tuple) 50
2.2.5  集合(Set) 54
2.2.6  字典(Dict) 60
2.3  Python文件的基本操作 65
2.3.1  文件读写基本操作 65
2.3.2  NumPy库存取文件 69
2.3.3  Pandas存取文件 73
2.4  本章小结 74
第3章  Python常用机器学习库 75
3.1  Python数值计算库NumPy 75
3.1.1  NumPy简介与安装 75
3.1.2  NumPy数组的基本操作 76
3.2  Python数据处理库Pandas 77
3.2.1  Pandas库简介与安装 77
3.2.2  数据读取与写入 77
3.2.3  数据清洗与转换 78
3.2.4  数据分析与可视化 79
3.3  Python数据可视化库Matplotlib 80
3.3.1  Matplotlib安装与基本使用 80
3.3.2  绘制折线图 82
3.3.3  绘制柱状图 84
3.3.4  绘制饼图 86
3.3.5  绘制子图 87
3.4  Python机器学习库scikit-learn 89
3.4.1  sklearn简介与安装 89
3.4.2  sklearn通用学习模式 89
3.4.3  sklearn数据集 90
3.4.4  sklearn模型的属性和功能 91
3.4.5  sklearn数据预处理 92
3.4.6  交叉验证 94
3.4.7  保存模型 96
3.5  本章小结 97
第4章  线性回归及应用 98
4.1  线性回归算法理论 98
4.2  回归算法的评价指标 100
4.3  梯度下降算法 101
4.3.1  算法理解 101
4.3.2  SGD算法理论 102
4.4  过拟合 103
4.4.1  过拟合产生的原因 103
4.4.2  常见线性回归正则化方法 104
4.5  线性回归实战 105
4.5.1  波士顿房价预测 105
4.5.2  加入正则化项 107
4.6  本章小结 108
第5章  分类算法及应用 109
5.1  逻辑回归理论与应用 109
5.1.1  算法理论知识 109
5.1.2  逻辑回归算法实战 110
5.2  SVM理论及应用 118
5.2.1  算法理论知识 119
5.2.2  SVM算法实战 120
5.3  朴素贝叶斯分类及应用 129
5.3.1  算法理论 129
5.3.2  朴素贝叶斯实战应用 130
5.4  决策树分类及应用 132
5.4.1  算法理论 132
5.4.2  ID3算法基础 133
5.4.3  决策树算法实战 136
5.5  随机森林算法实战 140
5.6  本章小结 141
第6章  数据降维及应用 142
6.1  数据降维概述 142
6.2  PCA算法 143
6.2.1  PCA算法理论 143
6.2.2  PCA算法实战 145
6.3  SVD算法 147
6.3.1  SVD理论 147
6.3.2  SVD实战应用 149
6.4  本章小结 152
第7章  聚类算法及应用 153
7.1  聚类理论基础 153
7.2  K-Means聚类 154
7.2.1  K-Means算法理论 154
7.2.2  K-Means算法实战 155
7.3  高斯混合聚类 163
7.3.1  高斯聚类理论 163
7.3.2  高斯混合聚类应用 165
7.4  谱聚类 166
7.4.1  谱聚类理论基础 167
7.4.2  谱聚类应用实战 168
7.5  本章小结 171
第8章  关联规则挖掘算法及应用 172
8.1  关联规则挖掘算法理论 172
8.1.1  大数据关联规则挖掘常识 172
8.1.2  经典的Apriori算法 173
8.1.3  FP树算法 174
8.2  关联规则挖掘算法实战 177
8.2.1  FP树实战 177
8.2.2  Apriori算法实战 182
8.3  本章小结 186
第9章  协同过滤算法及应用 187
9.1  协同过滤算法理论 187
9.1.1  协同过滤概述 187
9.1.2  物品相似度计算 189
9.1.3  关于ALS算法中的最小二乘法 190
9.2  协同过滤算法电影推荐实战 191
9.3  本章小结 196
第10章  新闻内容分类实战 197
10.1  数据准备 197
10.2  分词与清洗工作 199
10.3  模型建立 202
10.4  分类任务 203
10.5  本章小结 205
第11章  泰坦尼克号获救预测实战 206
11.1  数据处理 206
11.2  建立模型 209
11.3  算法概率计算 210
11.4  集成算法,构建多棵分类树 210
11.5  特征提取 211
11.6  集成多种算法 214
11.7  本章小结 215
第12章  中药数据分析项目实战 216
12.1  项目背景及目标 216
12.2  数据处理与分析实战 217
12.2.1  数据读取 217
12.2.2  中药材数据集的数据处理与分析 218
12.2.3  提取药方成分 221
12.2.4  挖掘常用药物组合 223
12.3  本章小结 227

正版购买

《机器学习实战(视频教学版)(人工智能技术丛书)》(迟殿委,王培进,王兴平)【摘要 书评 试读】- 京东图书 (jd.com)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/654454.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

利用预测大模型完成办公室饮水机剩余热水量

背景 在每天上班的时候,很多同事都有喝热水的习惯,但是饮水机内的热水量总是比较少的,如何避免等待,高效的接到热水是我接下来要做的事情的动机。 理论基础 在大量真实数据的情况下,可以分析出用水紧张的时间段和用水…

【全开源】场馆预定系统源码(ThinkPHP+FastAdmin+UniApp)

一款基于ThinkPHPFastAdminUniApp开发的多场馆场地预定小程序,提供运动场馆运营解决方案,适用于体育馆、羽毛球馆、兵乒球馆、篮球馆、网球馆等场馆。 场馆预定系统源码:打造高效便捷的预定体验 一、引言:数字化预定时代的来临 …

专业上门预约洗衣洗鞋管理系统一站式解决方案

洗衣洗鞋店管理系统一站式解决方案,不仅运营稳定且功能强大,堪称现代生活中的得力助手。 在这个快节奏的时代,人们对便捷性的渴望愈发强烈。洗衣洗鞋作为日常生活中的一项琐碎事务,也亟需一个高效、省心的解决方案。为此&#xf…

databricks~Unity Catalog

Unity Catalog hierarchy 包含了用户授权管理信息和元数据信息 workspace with unity catalog hierarchy unity metastore Ref: https://www.youtube.com/playlist?listPLY-V_O-O7h4fwcHcXgkR_zTLvddvE_GfC

Java常用工具类、包装类

1、工具类的设计 一般地,把那些完成通用功能的方法分类存放到类中,这些类就叫工具类。 工具类起名:XxxUtil、XxxUtils、XxxTool、XxxTools等,其中Xxx表示一类事物,比如ArrayUtil、StringUtil、JdbcUtil。 工具类存放的…

Windows内核函数 - 创建关闭注册表

在驱动程序的开发中,经常会用到对注册表的操作。与Win32的API不同,DDK提供另外一套对注册表操作的相关函数。首先明确一下注册表里的几个概念,避免在后面混淆。 图1 注册表概念 有5个概念需要重申一下: * 注册表项: 注…

LabVIEW步开发进电机的串口控制程序

LabVIEW步开发进电机的串口控制程序 为了提高电机控制的精确度和自动化程度,开发一种基于LabVIEW的实时、自动化电机串口控制程序。利用LabVIEW软件的图形化编程特性,通过串口实时控制电机的运行参数,实现电机性能的精准控制与评估。 系统组…

实现echarts多图联动效果

实现echarts多图联动效果 文章目录 实现echarts多图联动效果业务场景实现关键api代码示例(vue) 业务场景 提示:主要是记录一下多个echarts联动效果实现方案 这本来就是echarts本身自带的api,并没有多高级,奈何寻找的过…

Excel表格保护密码遗忘怎么办?三秒钟破解密码,轻松解锁!

在我们的日常工作中,Excel表格是一个非常实用的工具,但在某些情况下,我们可能会遇到密码忘记的问题,或者在尝试打开或删除文件时被锁定。别担心,这里有三个简单的解决方法来帮助您解决问题。 一、尝试默认密码或常见密…

RangeNet++ 检测3D点云语义算法的详细配置和常见问题

配置环境: Ubuntu18.04 GPU:GeForce MX150 驱动:Ubuntu推荐的nvidia-driver-470 Cuda10.1 cudnn7.6.2 TensorRT 5.1.5.0GCC 7.5.0 运行代码: RangeNet 目录 目录 一、环境配置 1. Ubuntu 18.04 安装NVIDIA驱动 &…

网络——多区域OSPF配置(OSPF系列第1篇)

简介 路由协议OSPF全称为Open Shortest Path First,也就开放是的最短路径优先协议,使用链路状态路由算法,isis协议也是使用链路状态路由算法。而RIP协议使用距离矢量路由算法。 区域 为了能够降低OSPF计算的复杂程度,OSPF采用分…

Redis解决缓存一致性问题

文章目录 ☃️概述☃️数据库和缓存不一致采用什么方案☃️代码实现☃️其他 ☃️概述 由于我们的 缓存的数据源来自于数据库, 而数据库的 数据是会发生变化的, 因此,如果当数据库中 数据发生变化,而缓存却没有同步, 此时就会有 一致性问题存在, 其后果是: 用户使用缓存中的过…

简爱的思维导图怎么做?从这三个角度

简爱的思维导图怎么做?《简爱》作为夏洛蒂勃朗特的代表作,不仅是一部经典的爱情小说,也是探索女性独立与自我成长的文学巨著。为了深入理解这部作品,制作思维导图是一种高效的学习和分析工具。以下是三种不同的角度来创建《简爱》…

【LeetCode算法】第88题:合并两个有序数组

目录 一、题目描述 二、初次解答 三、官方解法 四、总结 一、题目描述 二、初次解答 1. 思路:首次想到的解法:定义一个mn长度的辅助数组,从头遍历这两个数组,谁小就放进辅助数组中并且对应往后走,最后使用memcpy函…

VSCode开发Python-Django入门

一、安装配置Python环境及配置Python环境变量 1、python安装包安装后,需要注意pip.exe和pip3.exe的安装; 2、环境变量需要配置两个目录; 3、验证python是否安装成功 通过cmd命令执行:python --version 查看python版本&#xff…

解决 DataGrip 2024.1.3 连接 Tdengine 时timestamp字段显示时区不正确问题

设置中找到该设置,将原来的设置 yyyy-MM-dd HH:mm:ss 修改为: yyyy-MM-dd HH:mm:ss.SSS z 即可。 注意:只能修改第一个,修改后提示错误,但是查询数据时能成功格式化时间,修改第二个不生效,可能是 bug 具体格式见: Date…

如何取消公众号的在线客服绑定授权

1,功能设置 2,公众号设置 3,查看详情,取消

2024年新算法-秘书鸟优化算法(SBOA)优化BP神经网络回归预测

2024年新算法-秘书鸟优化算法(SBOA)优化BP神经网络回归预测 亮点: 输出多个评价指标:R2,RMSE,MSE,MAPE和MAE 满足需求,分开运行和对比的都有对应的主函数:main_BP, main_SBOA, main_BPvsBP_SB…

书生·浦语第二期-笔记2

课程链接:https://github.com/InternLM/Tutorial/tree/camp2 视频地址:轻松玩转书生浦语大模型趣味Demo_哔哩哔哩_bilibili 大模型及InternLM介绍 大模型:人工智能领域中参数数量巨大、拥有庞大计算能力和参数规模的模型 特点&#xff1a…

使用ssh连接ubuntu

一、下载连接工具 常见的连接工具右fianlshell、xshell等等。在本文章中使用的finalshell,工具可以去官网上下载,官网下载。 二、Ubuntu中配置shh 1、使用下面指令更新软件包(常用于下载安装或更新软件时使用,更新到最新的安装…