【兔子王赠书第7期】机器学习与人工智能实战:基于业务场景的工程应用

文章目录

  • 写在前面
  • 机器学习
  • 推荐图书
  • 写给读者
    • 前言
    • 本书面向的读者
    • 我为什么要写这本书
    • 运行本书的示例代码
    • 本书导航
    • 本书采用的约定
    • 使用代码示例
  • 推荐理由
  • 粉丝福利
  • 写在后面

写在前面

新的一周开始啦,本周博主给大家带来《机器学习与人工智能实战:基于业务场景的工程应用》,感兴趣的小伙伴快来看看吧!

机器学习

下面是一个使用Python实现简单线性回归模型的代码示例:

import numpy as np
import matplotlib.pyplot as plt

class SimpleLinearRegression:
    def __init__(self, learning_rate=0.01, iterations=1000):
        self.learning_rate = learning_rate
        self.iterations = iterations
        self.weights = None
        self.bias = None
        self.costs = []

    def fit(self, X, y):
        n_samples, n_features = X.shape
        
        self.weights = np.zeros(n_features)
        self.bias = 0
        
        for i in range(self.iterations):
            y_pred = np.dot(X, self.weights) + self.bias
            cost = (1 / n_samples) * np.sum((y_pred - y) ** 2)
            self.costs.append(cost)
            
            dw = (2 / n_samples) * np.dot(X.T, (y_pred - y))
            db = (2 / n_samples) * np.sum(y_pred - y)
            
            self.weights -= self.learning_rate * dw
            self.bias -= self.learning_rate * db

    def predict(self, X):
        y_pred = np.dot(X, self.weights) + self.bias
        return y_pred

# 使用样本数据演示简单线性回归模型
X = np.array([[1], [2], [3], [4], [5]])
y = np.array([3, 5, 7, 9, 11])

# 创建模型实例并进行训练
regressor = SimpleLinearRegression()
regressor.fit(X, y)

# 使用模型进行预测
y_pred = regressor.predict(X)

# 绘制训练数据和拟合线性回归模型的图像
plt.scatter(X, y)
plt.plot(X, y_pred, color='red')
plt.show()

线性回归

在上面的代码中,SimpleLinearRegression类是我们实现的简单线性回归模型。在fit方法中,我们使用最小二乘法进行训练,计算出最佳拟合直线的权重和偏置项。在predict方法中,我们使用这些权重和偏置项来预测新的未知数据。

在上述代码中,我们使用了一个简单的样例数据集,其中包含5个样本。我们绘制了这些数据及其线性拟合的模型,可以看到模型可以很好地拟合训练数据。

推荐图书

《机器学习与人工智能实战:基于业务场景的工程应用》

京东直达链接:https://item.jd.com/14101696.html

机器学习

写给读者

前言

我的一生见证过三次伟大的技术革命,先后是是个人电脑、互联网和智能手机。机器学习(ML)和人工智能(AI)的重要性与这三者比肩,并将对我们的生活产生同样深刻的影响。

记得有一天,信用卡公司打电话给我,向我确认我是不是要购买一条价值700 美元的项链。打那天起,我就对机器学习产生了兴趣。虽然并不是我要买,但我很好奇:“他们是怎么知道那可能不是我的呢?”我在世界各地都使用信用卡,而且要说明的是,我确实会时不时地给我的妻子买些好东西。信用卡公司从没拒绝过合法的刷卡交易,但有几次他们正确标记了信用卡诈骗。此前有一次是巴西某个家伙试图盗刷我的信用卡买机票。这一次不同的是,那家珠宝店距离我家只有2 英里。我试着想象,到底是一种怎样的算法可以在商店里如此靠谱地检测到信用卡欺诈盗刷。没过多久,我就意识到有种东西比单纯的算法更强大,是它在发挥作用。

事实证明,信用卡公司用了一个复杂的机器学习模型来运行每一笔交易,这个模型非常善于检测欺诈行为。有了这个意识之后,我的生活发生了变化,因为这个例子很有说服力,证明ML 和AI 可以使世界变得更美好。此外,了解ML 如何实时分析信用卡交易和筛选出非法交易的同时对合法交易开绿灯,成为我接下来注定要登顶的高峰。

本书面向的读者

最近,我接到某制造公司某位工程主管的电话。他是这样说的:“直到上周,我都不知道ML 和AI 是啥意思。现在,CEO 给我布置了任务,要我弄清楚它们如何赋能我们的业务,而且还要领先于竞争对手之前做到这一点。我现在要从头开始。你能帮忙吗?”

下一通电话来自一家想要使用机器学习来检测税务欺诈和洗钱行为的政府外包公司。团队对机器学习理论相当精通,但不知道如何以最好的方式建立可以满足其需要的模型。

全球各地的专业人士都意识到,ML 和AI 代表着一场技术海啸,他们试图抢占风口浪尖以免被吞没。本书就是为这些人准备的,他们包括工程师、软件开发人员、IT经理以及其他相关人员。他们想要实际理解ML 和AI 并应用这些知识来解决以前难以甚至不可能解决的问题。本书试图传达一种直观的理解,所以只有在必要时才“祭出”公式。无论你以前有没有听过,但你真的不必成为精通微积分或线性代数的高手,大多数人都能建一个系统来识别照片中的物体(对象或目标),将英语翻译成法语,或者爆光贩毒的人和偷税漏税的人。

我为什么要写这本书

每个作者的内心深处都住着一个小精灵,它让他们知道他们可以用别人不会的方式讲故事。我在30 多年前写了第一本计算机书,20 多年前写了最后一本,原本并不打算再写的。但现在我要讲一个故事。这个故事很重要,每个工程师和软件开发人员都应该听听。我对别人讲这个故事的方式不是完全满意,所以就写了这本书,我希望自己当初学习ML 和AI 时能够有这本书。它从基础知识开始,

带领大家攀登ML 和AI 世界中一座又一座的高峰。最后,让大家明白种种奥秘:信用卡公司如何检测欺诈行为?航空公司如何通过机器学习对喷气发动机进行预测性维护?自动驾驶汽车如何看周围的世界?谷歌翻译如何把文字翻译为另一种语言?面部识别系统如何工作?此外,你还能自己动手构建一个类似的系统或者使用现有的系统,将AI集成到自己写的应用程序中。

如今,最先进的机器学习模型需要在配备图形处理单元(GPU)或张量处理单元(TPU)的计算机上进行训练,而这通常要花费大量时间和费用。本书的一个特点是提供一些例子,这些例子能在没有配备GPU 的普通PC 或笔记本电脑上构建。在讲到识别照片中目标的计算机视觉模型时,我会解释这种模型是如何工作的以及它们如何在GPU 集群上用数以百万计的图像进行训练。但我随后会向大家展示如何使用迁移学习这种技术来重用现有模型以解决领域特有的问题,并在普通的笔记本电脑上训练模型。

本书在很大程度上取材于我在世界各地的公司和研究机构上过的课程和做过的研讨,我喜欢当老师,因为我喜欢看到有人眼里发光,从中得到了启发。在ML 和AI 的课程开始时我经常会说:“我不是来教书的,我是来改变你们的人生的!”希望你们的人生会从读这本书开始变得有一点点不同,有一点点好。

运行本书的示例代码

作为工程师,最好通过动手实践来学习新东西,而不仅仅是读书。本书包含大量代码示例,你可以通过运行这些例子来巩固每一章所学的知识。这些例子中,大多数是用Python 来写的,使用的是流行的开源库,例如Scikit-Learn、Keras 和TensorFlow。所有这些都可以在我专门建的一个GitHub 公共存储库中找到(https://oreil.ly/applied-machine-learning-code)。这是所有代码示例的唯一来源,我会随时保持更新。

有一些机器学习平台允许在不写代码的情况下构建和训练模型。但要想了解这些平台能做什么以及具体如何做,建议你最好还是写写代码。Python 是一种简单的编程语言。很容易学。今天的工程师必须会写代码。你可以通过本书的例子来学习Python,如果已经掌握了Python(以及更常规意义上的编程),那么说明你其实已经领先别人一步了。

若是要在台式计算机或笔记本电脑上运行我在书中提供的例子,则需要安装64 位的Python 3.7 或更高版本。可以从Python.org 下载一个Python 运行时或者可以安装一个Python 发行版,例如Anaconda(https://oreil.ly/4NCqN)。另外,还需要确保已经安装了以下软件包及其依赖项:

  • 用于构建机器学习模型的Scikit-Learn 和TensorFlow
  • 用于数据处理和可视化的Pandas、Matplotlib 和Seaborn
  • 用于图像处理的OpenCV 和Pillow
  • 用于调用REST API 和构建网络服务的Flask 和Requests
  • 用于开放神经网络交换( Open Neural Network Exchange,ONNX)模型的Sklearn-onnx 和Onnxruntime
  • 用于从音频文件生成频谱图的Librosa
  • 用于构建面部识别系统的MTCNN 和Keras-vggface
  • 用于构建自然语言处理(Natural Language Processing,NLP)模型的KerasNLP、Transformers、Datasets 和PyTorch
  • 用于调用Azure 认知服务(Azure Cognitive Services) 的Azurecognitiveservices-
    vision-computervision、Azure-ai-textanalytics 和Azurecognitiveservices-speech。

可以用 pip install 命令来安装其中大多数包。如果安装了 Anaconda,就表明其中许多包已经安装好了,可以用conda install 命令或类似的命令来安装其余的包。

至于环境,最好是用虚拟Python 环境来防止安装的这些包与其他包发生冲突。如果不熟悉虚拟环境,则可以在 Python.org 上阅读它们的相关信息。如果使用的是Anaconda,那么说明虚拟环境已经就位了。

我的大部分代码示例是为Jupyter 笔记本(Jupyter notebooks)构建的,后者为编写和执行Python 代码提供了一个交互平台。数据科学界经常使用“笔记本”来探索数据和训练机器学习模型。可以通过安装Notebook(https://oreil.ly/ZWQyG)或JupyterLab(https://oreil.ly/5A3Ia)等包在本地运行Jupyter 笔记本,也可以使用Google Colab(https://oreil.ly/RdRBa)等云托管环境。Colab 的优点是不必在自己的电脑上安装任何东西,就连Python 都不用。而且,在我的例子要求GPU的罕见情况下,Colab 也能为你提供GPU。

Python 开发环境难以设置和维护是出了名的,尤其是在Windows 电脑上。如果不想创建这样的环境,或者尝试过但没成功,那么下载一个东西就可以了。我在Docker容器镜像(https://oreil.ly/wzEbA)中打包了一个完整的开发环境,适合运行本书中的所有例子。如果你的电脑上安装了Docker 引擎(https://oreil.ly/XO5GD),那么可以用以下命令启动容器:
docker run -it -p 8888:8888 jeffpro/applied-machine-learning:latest
然后,在浏览器中访问输出结果中显示的URL,就会进入一个完整的Jupyter 环境,里面有我所有的代码示例和运行它们所需的一切。它们存储在一个文件夹中(名为Applied-Machine-Learning),该文件夹是从同名GitHub 存储库中克隆的。不过,使用容器有一个缺点,即所做的更改默认不会保存。补救办法之一是在docker 命令中使用-v 开关,从而绑定到一个本地目录。详情可以参考Docker 文档中的“绑定挂载”(https://oreil.ly/7wgda)。

本书导航

本书分为两部分。

  • 第I部分(第1章~第7章)讲解机器学习的基础知识,介绍流行的机器学习算法,比如逻辑回归和梯度提升。
  • 第II 部分(第8 章~第14 章)讨论深度学习。作为今天人工智能的代名词,它使用了深度神经网络来实现数学模型和数据拟合。

强烈建议在阅读本书时动手练习,以便能对这些内容有更深刻的理解,进而开始思考如何修改我在书中提供的代码,玩一玩“假如…?”(what if?)游戏。

本书采用的约定

本书采用了以下排版约定:
等宽字体(Constant width)
代码清单和段落中出现的程序元素(例如变量、函数、数据库、数据类型、环境变量、语句和关键字等)使用等宽代码字体。例如,from skl2onnx import convert_sklearn
等宽粗体(Constant width bold)
要由用户亲自输入的命令或其他字面值使用加粗的等宽字体。例如,请输入abc
这个视觉元素代表提示或建议
这个视觉元素代表常规的注意事项
这个视觉元素代表警告或提醒

使用代码示例

如前所述,本书的补充材料(代码实例、练习等)可以从https://oreil.ly/appliedmachine-learning-code 下载。

如果有技术问题或者在使用代码示例时遇到问题,请电邮至bookquestions@oreilly.com。

本书的目的是帮助大家完成自己的工作。一般来说,如果书中提供了示例代码,那么你可以在自己的程序和文档中使用。不需要联系我们获得许可,除非要复制代码的很大一部分。例如,写一个用到了本书几处代码的程序不需要许可。销售或分发O’Reilly 书中的示例则需要。引用本书正文和示例代码来回答一个问题不需要许可。将本书大量示例代码纳入你的产品文档,则需要许可。

我们感谢但一般不强求署名。如果要署名,通常应该包括标题、作者、出版商和ISBN。例如,Applied Machine Learning and AI for Engineers by Jeff Prosise(O’Reilly)。Copyright 2023 Jeff Prosise , 978-1-492-09805-8。

如果觉得对代码示例的使用超出了合理使用或上述许可的范畴,请随时联系我们:
permissions@oreilly.com。

推荐理由

《机器学习与人工智能实战:基于业务场景的工程应用》是一本非常实用的机器学习和人工智能方面的实战指南。这本书的推荐理由有以下几点:

  1. 丰富的实战案例:本书通过多个实际应用场景的案例,详细阐述了机器学习和人工智能的理论和应用,并给出了相应的代码实例,读者可以通过模仿这些实例来掌握机器学习和人工智能的实际应用。

  2. 专业的知识点讲解:本书通过对机器学习、深度学习、自然语言处理等方面的专业讲解,使读者能够深入了解这些技术的内部原理和工作机制。

  3. 实用的工具介绍:本书还介绍了一些常用的机器学习和人工智能工具和库,如Python、TensorFlow、Keras等,这些工具的介绍可以帮助读者更好地理解和应用这些技术。

  4. 面向实战的编程技巧:本书还介绍了一些面向实战的编程技巧,如数据清洗、特征工程、模型评估等,这些技巧可以帮助读者更好地解决实际业务问题。

  5. 深入浅出的讲解方式:本书的讲解方式非常深入浅出,循序渐进地给出了机器学习和人工智能的相关知识,并没有过多地使用专业术语和数学公式,使得读者可以更轻松地理解和掌握这些技术。

总之,《机器学习与人工智能实战:基于业务场景的工程应用》是一本非常实用的机器学习和人工智能方面的实战指南,适合想要了解和应用机器学习和人工智能的读者阅读。

粉丝福利

Part 1:

  • 现在 点赞收藏评论 “人生苦短,python当歌”
  • 评论区将随机抽取至多 五名 小伙伴 免费 赠书一本

Part 2:

  • 现在关注文末公众号并回复抽奖 ,即可增加中奖概率哦

截止日期:2023年11月20日

写在后面

跟着兔子王学python,就选《机器学习与人工智能实战:基于业务场景的工程应用》!

书

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/140933.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

五分钟利用Vite创建Vue项目

1.准备工具 Vite是尤雨溪团队开发的,官方称是下一代新型前端构建工具,能够显著提升前端开发体验。 上面称是下一代,当前一代当然是我们熟悉的webpack Vite 优势 开发环境中,无需打包操作,可快速的冷启动。轻量快速…

初始MySQL(五)(自我复制数据,合并查询,外连接,MySQL约束:主键,not null,unique,foreign key)

目录 表复制 自我复制数据(蠕虫复制) 合并查询 union all(不会去重) union(会自动去重) MySQL表的外连接 左连接 右连接 MySQL的约束 主键 not null unique(唯一) foreign key(外键) 表复制 自我复制数据(蠕虫复制) #为了对某个sql语句进行效率测试,我们需要海量…

【GEE学习日记】GEE下载ERA5指定小时数据

1 背景 ERA5数据集提供了逐小时的气象产品,最近做实验需要用到指定日期的14点的气象数据,所以学习了一下。 我的目的:获取2003年每月5,15,25日 14点的空气温度 2 代码 var roi table.geometry(); // table是我上传…

【计算机网络】VRRP协议理论和配置

目录 1、VRRP虚拟路由器冗余协议 1.1、协议作用 1.2、名词解释 1.3、简介 1.4、工作原理 1.5、应用实例 2、 VRRP配置 2.1、配置命令 2.2、拓扑与配置: 1、VRRP虚拟路由器冗余协议 1.1、协议作用 虚拟路由冗余协议(Virtual Router Redundancy Protocol&am…

11.13 牛客刷题8/10

11.13 信号完整性 指针地址 的加减,注意 最后转为16进制

插件式换肤框架原理解析

作者:ak 插件换肤实现原理概述 收集到需要换肤的控件确定控件中需要换肤的属性和资源ID加载插件APK,构造AssetManager并生成插件的Resource类,就可以加载插件包中的资源执行换肤:通过ID加载插件包中的资源,然后再通过…

C# 并发编程

C# 并发编程 前言 对于现在很多编程语言来说,多线程已经得到了很好的支持, 以至于我们写多线程程序简单,但是一旦遇到并发产生的问题就会各种尝试。 因为不是明白为什么会产生并发问题,并发问题的根本原因是什么。 接下来就让…

基于ssm课堂考勤系统-计算机毕设 附源码 50546

ssm课堂考勤系统 摘 要 21世纪的今天,随着社会的不断发展与进步,人们对于信息科学化的认识,已由低层次向高层次发展,由原来的感性认识向理性认识提高,管理工作的重要性已逐渐被人们所认识,科学化的管理&am…

Go的优雅退出

Go优雅退出/停机以前主要通过signal来实现,当然现在也是通过signal来实现,只是从go 1.16开始,新增了更加友好的API: func NotifyContext(parent context.Context, signals ...os.Signal) (ctx context.Context, stop context.CancelFunc) 该…

北邮22级信通院数电:Verilog-FPGA(9)第九周实验(2)实现下降沿触发的JK触发器(带异步复位和置位功能)

北邮22信通一枚~ 跟随课程进度更新北邮信通院数字系统设计的笔记、代码和文章 持续关注作者 迎接数电实验学习~ 获取更多文章,请访问专栏: 北邮22级信通院数电实验_青山如墨雨如画的博客-CSDN博客 JK.v module JK (input clk,input J,input K,input…

【C++类和对象下:解锁面向对象编程的奇妙世界】

【本节目标】 1. 再谈构造函数 2. Static成员 3. 友元 4. 内部类 5.匿名对象 6.拷贝对象时的一些编译器优化 7. 再次理解封装 1. 再谈构造函数 1.1 构造函数体赋值 在创建对象时,编译器通过调用构造函数,给对象中各个成员变量一个合适的初始值。…

CRM系统的销售管理功能,你了解多少?

很多时候,CRM系统直接被当做是销售管理系统,其实无可厚非,因为CRM系统本身是围绕销售逻辑来实现的,不仅可以有效的优化商机,对商机的把握也是十分精确。下面我们就来详细说说,CRM系统都有哪些销售管理功能&…

2023年数维杯国际大学生数学建模挑战赛A题

当大家面临着复杂的数学建模问题时,你是否曾经感到茫然无措?作为2022年美国大学生数学建模比赛的O奖得主,我为大家提供了一套优秀的解题思路,让你轻松应对各种难题。 cs数模团队在数维杯前为大家提供了许多资料的内容呀&#xff0…

2023.11.13【读书笔记】丨生物信息学与功能基因组学(第六章 多重序列比对 下)

目录 6.4 多重序列比对数据库6.5 基因组区域的多重序列比对6.6 展望6.7 常见问题总结 6.4 多重序列比对数据库 Pfam:基于谱隐马尔可夫模型构建的蛋白质家族数据库 SMART:简易分子构型研究工具,与细胞信号传导、细胞外结构域以及染色质功能…

炸裂!Sklearn 的 10 个宝藏级使用方法!

大家好,本次给大家介绍10个Sklearn方法,比较小众但非常好用。 1️.FunctionTransformer 虽然Sklearn中有很多内置的预处理操作可以放进pipeline管道,但很多时候并不能满足我们的需求。 如果是比较简单并且通过一个函数可以实现需求的情况&…

CSDN每日一题学习训练——Java版(字符串相乘、子集、删除链表的倒数第 N 个结点)

版本说明 当前版本号[20231112]。 版本修改说明20231112初版 目录 文章目录 版本说明目录字符串相乘题目解题思路代码思路补充说明参考代码 子集题目解题思路代码思路参考代码 删除链表的倒数第 N 个结点题目解题思路代码思路参考代码 字符串相乘 题目 给定两个以字符串形…

面向切面:AOP

面向切面:AOP 大家好,今天本篇博客我们来了解Spring里边的另一个重要部分,叫做AOP,也就是我们说的面向切面编程。 1、场景模拟 首先第一部分,咱们做一个场景模拟。我们先写一个简单的例子,然后通过例子引…

探索向量数据库 | 重新定义数据存储与分析

随着大模型带来的应用需求提升,最近以来多家海外知名向量数据库创业企业传出融资喜讯。 随着AI时代的到来,向量数据库市场空间巨大,目前处于从0-1阶段,预测到2030年,全球向量数据库市场规模有望达到500亿美元&#xff…

CSDN每日一题学习训练——Java版(数据流的中位数、乘积最大子数组、旋转链表)

版本说明 当前版本号[20231113]。 版本修改说明20231113初版 目录 文章目录 版本说明目录数据流的中位数题目解题思路代码思路参考代码 乘积最大子数组题目解题思路代码思路参考代码 旋转链表题目解题思路代码思路参考代码 数据流的中位数 题目 中位数是有序列表中间的数。…