机器学习 | 四大常用机器学习Python库介绍

今天这篇我们介绍下Python中常用的机器学习库(机器学习、深度学习啥的,小编还是建议使用Python进行建模编写哈),也算是本公号机器学习的第一篇推文,主要内容如下:

  • 机器学习常用四大Python库

  • 关于机器学习的我想说的话

  • 所有完整代码都已整理之我们的线上课程,有需要的同学+v yidianshuyulove 咨询

深度学习常用四大Python库

这一部分我们简单介绍下Python中的常用的机器学习库,算是比较入门的介绍哈,具体包括Scikit-learn、Keras、TensorFlow和PyTorch,下面我们就一一简单介绍:

Scikit-learn

  1. 「官网」

网址:https://scikit-learn.org/stable/

  1. 「简单介绍」

Scikit-learn(sklearn)是机器学习中常用的第三方模块,其对常用的机器学习方法进行了封装,具体包括回归(Regression)、降维(Dimensionality Reduction)、分类(Classfication)、聚类(Clustering)等方法。主要特点:

  • 简单高效的数据挖掘和数据分析工具

  • 够在复杂环境中重复使用

  • 建立NumPy、Scipy、MatPlotLib之上

  1. 「官方样例及示图」

  • Classification(分类)

Classification

  • Regression(回归)

Regression

  • Clustering(聚类)

Clustering

更多内容,小伙伴们可参考上方官网哈

Keras

这个库也是小编较常使用的深度学习库,其高度集成式可帮助你快速搭建深度学习网络。值得一提的是,官方也提供了对应的中文网站哦,帮助大家更好的理解。

  1. 「官网」

网址:https://keras.io/zh/

  1. 「简单介绍」

Keras是一个由Python编写的开源人工神经网络库,在代码结构上由面向对象方法编写,完全模块化并具有可扩展性,其运行机制和说明文档有将用户体验和使用难度纳入考虑,并试图简化复杂算法的实现难度。特点如下:

  • 支持现代人工智能领域的主流算法,包括前馈结构和递归结构的神经网络,

  • 可通过封装参与构建统计学习模型。

  • 支持多操作系统下的多GPU并行计算。

  1. 「官方样例及示图」

  • 基于多层感知器 (MLP) 的 softmax 多分类:

import keras
from keras.models import Sequential
from keras.layers import Dense, Dropout, Activation
from keras.optimizers import SGD

# 生成虚拟数据
import numpy as np
x_train = np.random.random((1000, 20))
y_train = keras.utils.to_categorical(np.random.randint(10, size=(1000, 1)), num_classes=10)
x_test = np.random.random((100, 20))
y_test = keras.utils.to_categorical(np.random.randint(10, size=(100, 1)), num_classes=10)

model = Sequential()
# Dense(64) 是一个具有 64 个隐藏神经元的全连接层。
# 在第一层必须指定所期望的输入数据尺寸:
# 在这里,是一个 20 维的向量。
model.add(Dense(64, activation='relu', input_dim=20))
model.add(Dropout(0.5))
model.add(Dense(64, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(10, activation='softmax'))

sgd = SGD(lr=0.01, decay=1e-6, momentum=0.9, nesterov=True)
model.compile(loss='categorical_crossentropy',
              optimizer=sgd,
              metrics=['accuracy'])

model.fit(x_train, y_train,
          epochs=20,
          batch_size=128)
score = model.evaluate(x_test, y_test, batch_size=128)
  • 基于多层感知器的二分类

import numpy as np
from keras.models import Sequential
from keras.layers import Dense, Dropout

# 生成虚拟数据
x_train = np.random.random((1000, 20))
y_train = np.random.randint(2, size=(1000, 1))
x_test = np.random.random((100, 20))
y_test = np.random.randint(2, size=(100, 1))

model = Sequential()
model.add(Dense(64, input_dim=20, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(64, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(1, activation='sigmoid'))

model.compile(loss='binary_crossentropy',
              optimizer='rmsprop',
              metrics=['accuracy'])

model.fit(x_train, y_train,
          epochs=20,
          batch_size=128)
score = model.evaluate(x_test, y_test, batch_size=128)
  • 基于 LSTM 的序列分类

from keras.models import Sequential
from keras.layers import Dense, Dropout
from keras.layers import Embedding
from keras.layers import LSTM

max_features = 1024

model = Sequential()
model.add(Embedding(max_features, output_dim=256))
model.add(LSTM(128))
model.add(Dropout(0.5))
model.add(Dense(1, activation='sigmoid'))

model.compile(loss='binary_crossentropy',
              optimizer='rmsprop',
              metrics=['accuracy'])

model.fit(x_train, y_train, batch_size=16, epochs=10)
score = model.evaluate(x_test, y_test, batch_size=16)

通过以上样例可以发现,只需简单的集成化操作就可以构建出浅层甚至多层的神经网络模型,还是十分方便的。更多样例和操作方法,大家可参考官网哈~~

TensorFlow

  1. 「官网」

网址:https://tensorflow.google.cn/

  1. 「简单介绍」

TensorFlow是一个开放源代码软件库,用于进行高性能数值计算,是一个用于研究和生产的开放源代码机器学习库。其提供了各种 API,可供初学者和专家在桌面、移动、网络和云端环境下进行开发,采用数据流图(Data Flow Graphs)来计算。

  1. 「官方样例」 TensorFlow 官网提供详细而全面的教程和应用文章,大家可前往阅读。

PyTorch

其实这个库吧,在我刚接触深度学习时还不是特别大众化,但在我 快毕业时,其越来越被接受和使用,我想这与其可高度自定义化操作特点有关。

  1. 「官网」

网址:https://pytorch.org/

  1. 「简单介绍」

PyTorch是一个开源的Python机器学习库,基于Torch,用于自然语言处理等应用程序。2017年1月,由Facebook人工智能研究院(FAIR)基于Torch推出了PyTorch。它是一个基于Python的可续计算包,提供两个高级功能:

  • 具有强大的GPU加速的张量计算(如NumPy)。

  • 包含自动求导系统的深度神经网络。

「特点如下:」

  • PyTorch是相当简洁且高效快速的框架。

  • 设计追求最少的封装。

  • 设计符合人类思维,它让用户尽可能地专注于实现自己的想法。

  • 与google的Tensorflow类似,FAIR的支持足以确保PyTorch获得持续的开发更新。

  • PyTorch作者亲自维护的论坛 供用户交流和求教问题。

  • 入门简单。

  1. 「官方样例」

  • TRAINING A CLASSIFIER(分类训练)

网址:https://pytorch.org/tutorials/beginner/blitz/cifar10_tutorial.html#sphx-glr-beginner-blitz-cifar10-tutorial-py

  • TORCHVISION OBJECT DETECTION FINETUNING TUTORIAL(目标检测)

网址:https://pytorch.org/tutorials/intermediate/torchvision_tutorial.html

Mask R-CNN adds an extra branch into Faster R-CNN, which also predicts segmentation masks for each instance.

更多优秀案例,大家可阅读PyTorch官网。

关于机器学习的我想说的话

其实对于机器学习或者深度学习,小编的建议还是熟练掌握Scikit-learn、Keras以及PyTorch,这里不是要求掌握到自己熟练编写网络层,但要对其原理有所了解,使自己可以对其进行简单的修改。因为我们实际工作中用到的模型早已经成熟或者开源,大家完全可以去Github上进行下载和解读。但对一些科研需求,则需要自己进行代码 修改甚至相关网络层的编写。本公号后续推出的机器学习相关推文也会从简至难,也会有完整的流程化步骤帮助大家更好地将理论应用到实际上。

最后,给正在追求精度的模型小伙伴说句话:“这玩意吧~精度和结果有时候真得看运气”,具体原因就不说了,有经验的我们会心一笑即可

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/427395.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

mysql高可用架构设计

一、主从架构 1.主从复制 1.主从复制原理 Mysql的主从复制中主要有三个线程: master(binlog dump thread)、slave(I/O thread 、SQL thread) ,Master一条线程和Slave中的两条线程。 整体上来说&#xff…

如何合理布局子图--确定MATLAB的subplot子图位置参数

确定MATLAB的subplot子图位置参数 目录 确定MATLAB的subplot子图位置参数摘要1. 问题描述2. 计算过程2.1 确定子图的大小和间距2.2 计算合适的figure大小2.3 计算每个子图的position数据 3. MATLAB代码实现3.1 MATLAB代码3.2 绘图结果 4. 总结 摘要 在MATLAB中,使用…

2024-简单点-picamera2除了文档还有哪里可以学习实例?

picamera2学习例子 去github的picamera2库,找app和examples目录,然后学习

重建大师实时建模支持华为的npu吗?

可以支持适配。重建大师推出信创版,可全面支撑国产信创环境。 重建大师是一款专为超大规模实景三维数据生产而设计的集群并行处理软件,输入倾斜照片,激光点云,POS信息及像控点,输出高精度彩色网格模型,可一…

NumpyPython 笔记1 3.4

array.ndim 几维 array.shape 几行,几列 array.size 存在多少个元素 np.array 转化为矩阵 dtype 确定类型,并且确定精度64?32?16?数字越小,越不精确 二维 np.zeros 生成零矩阵,并且规…

uniapp实战:父子组件传参之子组件数量动态变化

需求说明 现有的设置单元列表,每个带有虚线加号的可以看做是一组设置单元,点击加号可以添加一组设置单元.点击设置单元右上角可以删除对应的设置单元. 实现思路说明 利用数组元素添加或是删除的方式实现页面数量动态变化.由于每个设置单元内容都相同所以单独封装了一个子组件.…

开发知识点-Ruby

Ruby https://m.runoob.com/ruby/ruby-installation-windows.htmlhttps://rubyinstaller.org/downloads/

新书速览|Photoshop+CorelDRAW商业广告设计入门到精通:视频教学版

8章实例剖析商业案例,帮你提升设计效率。商业实战案例,真正掌握设计技能! 本书内容 《PhotoshopCorelDRAW商业广告设计入门到精通:视频教学版》以创作精美、类型多样的案例,全面地讲解Photoshop与CorelDRAW软件相结合…

ssh无法直接登入Linux超级用户root(23/3/3更新)

说明:不允许ssh用超级用户的身份登入是为了安全性,如果只是学习使用对安全性没啥要求可以按以下操作解除限制 以普通用户登录到服务器后,执行以下命令以编辑 SSH 服务器配置文件 /etc/ssh/sshd_config sudo nano /etc/ssh/sshd_config 此时会…

【日常聊聊】程序员如何选择职业赛道

🍎个人博客:个人主页 🏆个人专栏:日常聊聊 ⛳️ 功不唐捐,玉汝于成 目录 前言 正文 方向一:自我评估与兴趣探索 方向二:市场需求与趋势分析 方向三:成功案例与经验教训 结语…

记录踩过的坑-macOS下使用VS Code

目录 切换主题 安装插件 搭建Python开发环境 装Python插件 配置解释器 打开项目 打开终端 INFO: pip is looking at multiple versions xxxx,过了很久后报错 ​​​​​​​ 切换主题 安装插件 方法1 方法2 搭建Python开发环境 装Python插件 配置解释器 假…

【漏洞复现】某厂商明御WEB应用防火墙任意用户登录漏洞

Nx01 产品简介 安恒明御WEB应用防火墙(简称WAF)是杭州安恒信息技术股份有限公司自主研发的一款专业应用安全防护产品,专注于为网站、APP等Web业务系统提供安全防护。 Nx02 漏洞描述 安恒明御WEB应用防火墙report.php文件存在硬编码设置的Con…

Linux系统Docker部署RStudio Server

文章目录 前言1. 安装RStudio Server2. 本地访问3. Linux 安装cpolar4. 配置RStudio server公网访问地址5. 公网远程访问RStudio6. 固定RStudio公网地址 前言 RStudio Server 使你能够在 Linux 服务器上运行你所熟悉和喜爱的 RStudio IDE,并通过 Web 浏览器进行访问…

redis08 主从复制

思维草图 认识 主机更新后根据配置和策略,自动将数据同步到备机的master/slave机制,Master以写为主,Slave以读为主。 为什么要使用主从复制 读写分离,性能扩展,降低主服务器的压力容灾,快速恢复&#xf…

[VSCode插件] 轻量级静态博客 - MDBlog

MDBlog VSCode插件,基于Markdown的轻量级静态博客系统,同时支持导出为可以部署的静态博客。 仓库 MDBlog 1. Features 博客基础功能:分类管理、文章管理、自动生成索引快捷指令:快捷输入表格、mermaid、wavedrom、代码块发布&a…

企企通龙年首秀——2024华南采购峰会,赋能企业供应链高质量发展之路

开年第一个工作日,广东省高质量发展大会在深圳召开,处在高质量发展阶段的广东,正加快产业和科技融合发展,坚持以科技创新引领现代化产业体系建设,勇立潮头,抢占先机。 一年之计在于春。迎着高质量发展大会的…

P9905 [COCI 2023/2024 #1] AN2DL 【矩阵区间最大值】

文章目录 题目大意1.输入格式2.输出格式3.数据范围与约定 思路维护每一行区间维护每一列区间维护区间最大值code↓ 完结撒花( ̄▽ ̄) / 题目大意 给定 n , m , r , s n,m,r,s n,m,r,s 和一个 n m n\times m nm 的整数矩阵 A A A,求它每个 …

Spring的Bean的生命周期 | 有图有案例

Spring的Bean的生命周期 Spring的Bean的生命周期整体过程实例化初始化服务销毁循环依赖问题 完整生命周期演示 Spring的Bean的生命周期 Spring Bean的生命周期:从Bean的实例化之后,通过反射创建出对象之后,到Bean称为一个完整的对象&#xf…

数据中台:数字中国战略关键技术实施

这里写目录标题 前言为何要建设数据中台数据中台建设痛点数据中台学习资料聚焦前沿,方法论体系更新与时俱进,紧跟时代热点深入6大行业,提炼实践精华大咖推荐,数字化转型必备案头书 前言 在数字中国这一国家战略的牵引下&#xff0…

SpringBoot-yaml语法

1.概念 在Springboot的项目中,配置文件有以下几种格式: Application.propertiesApplication.yamlApplication.yml 其中官方推荐我们使用yaml的格式(因为能表示的数据类型很多样) 2.基本语法 # yaml形式的配置文件# 普通的key-value(分号之后…