【最全面最优质的PyTorch学习资源】

纯 PyTorch 资源

PyTorch 博客

https://pytorch.org/blog/

PyTorch 文档

https://pytorch.org/docs

PyTorch 性能调优指南

https://pytorch.org/tutorials/recipes/recipes/tuning_guide.html#

PyTorch Recipes

https://pytorch.org/tutorials/recipes/recipes_index.html

PyTorch Recipes 是一系列小教程,用于展示你可能想要创建的常见 PyTorch 功能和工作流程,例如在 PyTorch 中加载数据以及在 PyTorch 中保存和加载模型以进行推理。

PyTorch 生态系统

https://pytorch.org/ecosystem/

大量基于纯 PyTorch 构建的工具,用于为不同领域添加专门的功能,从用于 3D 计算机视觉的 PyTorch3D 到用于快速数据增强的 Albumentations 再到用于模型评估的 TorchMetrics。

在 VSCode 中设置 PyTorch

https://code.visualstudio.com/docs/datascience/pytorch-support

VSCode 是目前最流行的 IDE 之一。而且它对 PyTorch 的支持越来越好。

基于 PyTorch 的外部库

fast.ai

https://github.com/fastai/fastai

fastai 是一个开源库,它负责构建神经网络的许多繁琐的部分,并使得仅用几行代码即可创建最先进的模型成为可能。他们的免费库、课程和文档都是世界一流的。

MosaicML

https://github.com/mosaicml/composer

用于更高效的模型训练:你训练模型的速度越快,你就能越快地找出哪些方法有效,哪些方法无效。MosaicML 的开源 Composer 库通过在后台实现加速算法来帮助你更快地使用 PyTorch 训练神经网络,这意味着你可以更快地从现有的 PyTorch 模型中获得更好的结果。他们的所有代码都是开源的,他们的文档非常棒。

PyTorch Lightning

https://www.pytorchlightning.ai/

PyTorch Lightning 可处理你在纯 PyTorch 中经常需要手动执行的许多步骤,例如编写训练和测试循环、模型检查点、日志记录等。PyTorch Lightning 建立在 PyTorch 之上,可让你使用更少的代码创建 PyTorch 模型。

图片

从哪里寻找数据集

机器学习项目始于数据。没有数据,就没有机器学习。

以下资源是查找各种主题和问题领域的开源且通常随时可用的数据集的最佳资源。

Paperswithcode 数据集

https://paperswithcode.com/datasets

搜索最常用和最常见的机器学习基准数据集,了解它们包含的内容、来源和可找到的位置。你通常还可以看到每个数据集上当前表现最佳的模型。

HuggingFace 数据集

https://huggingface.co/docs/datasets

不仅是查找各种问题领域的数据集的资源,而且还是下载并开始在几行代码内使用它们的库。

添加链接描述

Kaggle 数据集

https://www.kaggle.com/datasets

查找通常伴随 Kaggle 竞赛的各种数据集,其中许多数据集直接来自行业。

Google 数据集搜索

https://datasetsearch.research.google.com/

就像在 Google 上搜索一样,但是专门用于数据集。

这些应该足以让您入门,但是,对于您自己的特定问题,您可能需要构建自己的数据集。

图片

深度学习领域的工具

以下资源主要针对特定问题领域(例如计算机视觉和推荐引擎/系统)的库和预训练模型。

计算机视觉

如果你的数据是视觉、图像、X 光扫描、生产线视频甚至手写文档,则可能是计算机视觉问题。

TorchVision — PyTorch 的常驻计算机视觉库。找到大量加载视觉数据的方法以及大量用于解决自己问题的预训练计算机视觉模型。
https://pytorch.org/vision/stable/index.html

timm(Torch 图像模型)库 — 最全面的计算机视觉库和预训练计算机视觉模型资源之一。几乎所有使用 PyTorch 进行计算机视觉的新研究都以某种方式利用了 timm 库。
https://github.com/rwightman/pytorch-image-models

Yolov5 用于对象检测 — 如果你希望在 PyTorch 中构建对象检测模型,yolov5 GitHub 仓库可能是最快的入门方式。
https://github.com/ultralytics/yolov5

VISSL(视觉自监督学习)库 — 自监督学习是让数据本身学习模式的艺术。自监督学习不是为不同类别提供标签并学习这样的表示,而是尝试在没有标签的情况下复制类似的结果。VISSL 提供了一种易于使用的方法,可以开始使用 PyTorch 进行自监督学习计算机视觉模型。
https://github.com/facebookresearch/vissl

自然语言处理

TorchText — PyTorch 内置的文本域库。与 TorchVision 一样,它包含大量用于加载数据的预构建方法和大量可用于解决自己问题的预训练模型。
https://pytorch.org/text/stable/index.html

HuggingFace Transformers 库 — HuggingFace Transformers 库在 GitHub 上的星星数比 PyTorch 库本身多。这是有原因的。并不是说 HuggingFace Transformers 比 PyTorch 更好,而是因为它在自己的领域是最好的:为 NLP 提供数据加载器和预训练的最先进的模型等等。
https://huggingface.co/docs/transformers/index

福利:要了解有关如何使用 HuggingFace Transformers 库及其所有相关组件的更多信息,HuggingFace 团队提供免费的在线课程。
https://huggingface.co/learn

语音

TorchAudio — PyTorch 的音频领域库。查找用于准备数据的内置方法和用于在音频数据中查找模式的预构建模型架构。
https://pytorch.org/audio/stable/index.html

SpeechBrain — 一个基于 PyTorch 构建的开源库,用于处理语音问题,例如识别(将语音转换为文本)、语音增强、语音处理、文本转语音等。
https://speechbrain.github.io/

推荐系统

https://pytorch.org/torchrec/

TorchRec 是 PyTorch 最新的内置域库,用于通过深度学习为推荐引擎提供支持。TorchRec 附带推荐数据集和模型,可供尝试和使用。但是,如果自定义推荐引擎无法满足你的要求(或工作量太大),许多云供应商都会提供推荐引擎服务。

https://pytorch.org/torchrec/

时序数据

如果你的数据包含时间成分,并且你想利用过去的模式来预测未来,例如预测明年比特币的价格或更合理的问题,即预测下周某个城市的电力需求,你将需要研究时间序列库。

这两个库不一定使用 PyTorch,但是,由于时间序列是一个常见的问题,我将它们包括在这里。

Salesforce Merlion — 使用 Merlion 的数据加载器、预构建模型、AutoML(自动机器学习)超参数调整等,将你的时间序列数据转化为智能,用于时间序列预测和时间序列异常检测,所有这些都受到实际用例的启发。
https://github.com/salesforce/Merlion

Facebook Kats — Facebook 的整个业务都依赖于预测:什么时候是投放广告的最佳时机?所以你可以打赌他们在时间序列预测软件上投入了大量资金。Kats(用于分析时间序列数据的工具包)是他们用于时间序列预测、检测和数据处理的开源库。
https://github.com/facebookresearch/Kats

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/718681.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

AI 有感:智能体 = 提示词工程 + 大模型算力 + 插件类工具?

回顾 继这篇文章推出:怎么看 AI 大模型(LLM)、智能体(Agent)、知识库、向量数据库、知识图谱,RAG,AGI 的不同形态? 引起了很多粉丝朋友的反响,随着目前各大模型的发布以…

PBC密码库安装及使用教程

文章目录 1.PBC库介绍2.PBC库安装3.PBC库使用4.相关API4.1 配对的初始化和释放4.2 元素的初始化和释放4.3 元素的赋值4.4 哈希4.5 元素的常用运算4.6 元素的幂运算4.7 元素的比较4.8 从群中随机选取一个元素(常用)4.9 配对的运算4.10 小结 5.Some exampl…

Unity 使用TextMeshPro实现图文混排

最后实现出的效果是这样的 开始实现 准备两张图 选中图片右键->Create->TextMeshPro->Sprite Asset 然后文件夹内就会出现一个同名的这个文件 新建一个Text Inspector面板 点击最底下的Extra Settings 然后把刚刚创建的SpriteAsset拖过来 放到对应的地方 然后…

牛客周赛 E-茜茜的计算器

原题链接:E-茜茜的计算器​​​​​​ 题目大意:在计算器上显示的0~9十个数字,如果这个计算器有n个位置,可以显示n个数字,问能显示多少种不同的对称数字。只能横轴和竖轴对称。 思路:容斥,最终…

Docker(二)-Centos7安装Docker并配置镜像加速

系统用户为非root用户 1.安装条件 确定Centos版本是否是7及以上sudo vim /etc/redhat-release2.官网地址 https://docs.docker.com/engine/install/centos3.卸载已安装的旧版本 sudo yum remove docker \docker-client \docker-client-latest \docker-common \docker-lates…

数字孪生定义及应用介绍

数字孪生定义及应用介绍 1 数字孪生(Digital Twin, DT)概述1.1 定义1.2 功能1.3 使用场景1.4 数字孪生三步走1.4.1 数字模型1.4.2 数字影子1.4.3 数字孪生 数字孪生地球平台Earth-2 参考 1 数字孪生(Digital Twin, DT)概述 数字孪…

项目(一)--高并发内存池项目简介

什么是高并发内存池 它是一个全球性大厂google(谷歌)的 开源项目,项目名字叫tcmalloc,全称是Thread-Caching Malloc,即线程缓存的malloc 作用: 我们知道C语言在堆上开辟空间和 释放使用的是malloc和free函数 并且C的动态内存管理new和delete 的底层实际上也调用了…

白酒行业数字化营销转型方向

白酒行业正站在数字化营销的新风口,随着科技的迅猛发展和消费者行为模式的变革,这一传统行业正迎来前所未有的发展机遇。数字化营销不仅为白酒企业打开了新的市场大门,更在重塑消费者与品牌之间的关系,推动行业向更智能、更个性化…

day02论文学习:能够使大语言模型产生带有引用的文章

1.主题:Enabling Large Language Models to Generate Text with Citations(能够使大语言模型产生带有引用的文章) 引用出处: Gao, T., Yen, H., Yu, J., & Chen, D. (2023). Enabling Large Language Models to Generate Tex…

05通讯录管理系统——添加联系人

功能描述:实现添加联系人功能,联系人上限为1000人,联系人信息包括姓名、性别、年龄、联系电话、家庭住址。 添加联系人实现步骤: 1.设计联系人结构体 2.设计通讯录结构体 3.main函数中创建通讯录 4.封装添加联系人函数 5.测…

2024-06-17 问AI: 在深度学习中,harmonic mean是什么?

文心一言 在深度学习中,**harmonic mean(调和平均数)**是一个用于评估模型性能的指标,特别是在处理不平衡的数据集或需要综合多个评估指标的场景中。以下是关于harmonic mean在深度学习中应用的详细解释: 定义&#…

多态深度剖析

前言 继承是多态的基础, 如果对于继承的知识还不够了解, 可以去阅读上一篇文章 继承深度剖析 基本概念与定义 概念: 通俗来说,就是多种形态。具体点就是去完成某个行为, 当不同的对象去完成时会产生出不同的状…

湿法消解石墨消解仪 应用化学分析领域石墨炉

石墨消解仪在化学实验中具有重要的作用。它是一种高级实验设备,广泛应用于化学分析领域,特别是在样品的前处理和测试前的样品制备过程中。 石墨消解仪采用高温高压技术,能够将固体样品中的有机和无机物质转化为可溶性的气体或液体形式。这种…

Aeron:两个代理之间的单向IPC(One-way IPC between two agents)

一、概述 本例展示了如何通过 IPC 在调度于不同线程的两个代理之间传输缓冲区。在继续学习本示例之前,最好先复习一下Simplest Full Example ,因为该示例展示的是 IPC 通信,没有增加代理的复杂性。读者还应熟悉Media Driver 流程构建如下&…

结合Boosting理论与深度ResNet:ICML2018论文代码详解与实现

代码见:JordanAsh/boostresnet: A PyTorch implementation of BoostResNet 原始论文:Huang F, Ash J, Langford J, et al. Learning deep resnet blocks sequentially using boosting theory[C]//International Conference on Machine Learning. PMLR, 2…

英特尔 “AI” 科通:英特尔AI大模型应用前瞻

亲爱的科技探险家、前沿探索者、对未来深具好奇心的您, 身处人工智能引领的时代,我们目睹着行业的革命性变革。技术的创新不仅改变着我们的日常,更重新定义着我们对未来的期许。今天,怀着无限激情和期待,我们邀请您参…

国际数字影像产业园:建设与推动企业孵化与梯次培育

国际数字影像产业园在建设与推动企业孵化及梯次培育方面取得了显著成效。未来,随着技术的不断进步和市场的不断扩大,园区将继续发挥其在数字经济产业中的引领作用,为文化产业的发展贡献更多力量。 一、企业孵化与入驻 企业入驻情况&#xff…

物联边缘网关如何助力工厂实现智能化生产?以某智能制造工厂为例-天拓四方

随着工业4.0的深入推进,智能制造工厂成为了工业发展的重要方向。在这个背景下,物联边缘网关以其独特的优势在智能制造工厂中发挥着越来越重要的作用。以下将通过一个具体的智能制造工厂应用案例,来阐述物联边缘网关如何助力工厂实现智能化生产…

Milvus跨集群数据迁移

将 Milvus 数据从 A 集群(K8S集群)迁到 B 集群(K8S集群),解决方案很多,这里提供一个使用官方 milvus-backup 工具进行数据迁移的方案。 注意:此方案为非实时同步方案,但借助 MinIO 客…

在3D视觉技术的帮助下,轻松实现纸箱拆码垛

在繁忙的物流仓库中,纸箱的拆码垛工作常常让人头疼不已。但是,现在有了富唯智能的3D视觉引导纸箱拆码垛解决方案,这一切都变得轻松简单! 想象一下,那些堆积如山的纸箱,在3D视觉技术的帮助下,仿…