Hugging Face入门(一)

简介

本文主要内容:

  • Hugging Face介绍
  • 环境搭建
  • 敲两个例子

Hugging Face介绍

在这里插入图片描述

Hugging Face 是一家法美合资公司,总部位于纽约市,成立于2016年。它由法国企业家Clément DelangueJulien ChaumondThomas Wolf在纽约市创立,最初是一家专注于开发面向青少年的聊天机器人应用的公司。该公司的初始产品是一个能够从用户互动中学习的对话代理。有趣的是,这个聊天机器人的名字来源于“拥抱脸”表情符号.

随着该公司将聊天机器人背后的模型开源,它转变为一个专注于机器学习的平台。Hugging Face 最著名的是其针对自然语言处理应用构建的transformers库,以及允许用户共享机器学习模型和数据集并展示其工作的平台。这个社区充满活力,致力于通过开源和开放的科学方法推动人工智能的发展。

在2021年3月,Hugging Face 在一轮B轮融资中筹集了4000万美元。此外,该公司还与其他研究团队合作,于2021年4月28日推出了BigScience研究研讨会,发布了一个开放的大型语言模型。在2022年,该研讨会宣布了一个具有1760亿参数的多语言大型语言模型——BLOOM .

此外,Hugging Face 还在2022年收购了Gradio,这是一个用于开发Python机器学习应用程序的开源库。该公司还在2022年5月5日宣布了C轮融资,由Coatue和Sequoia领投,估值达到20亿美元。在2022年8月3日,该公司推出了Private Hub,这是其公共Hugging Face Hub的企业版本,支持SaaS或本地部署。此外,该公司还与亚马逊网络服务(AWS)合作,使Hugging Face 的产品可供AWS客户用作构建自定义应用程序的基石。下一代BLOOM 将在AWS创建的专有机器学习芯片Trainium上运行 .

最近,该公司在2023年8月宣布完成了D轮融资,筹集了2.35亿美元,估值达到45亿美元。此次融资由Salesforce领投,谷歌、亚马逊、NVIDIA、AMD、英特尔、IBM和高通等知名公司也参与其中。

总之,Hugging Face 通过其丰富的资源和社区,为机器学习开发者和研究人员提供了强大的工具,推动了自然语言处理和其他领域的创新。.

环境搭建

本次主要学习一下transformers的试用,所以主要需要安装这几个库:

pip install transformers datasets

还要安装机器学习框架

pip install torch
#或者
pip install tensorflow

然后经过解决一系列问题,你可能发现,装了半天各个软件不兼容,所以如果只是打算入门,推荐使用这个:
Colaboratory

附上一个简单介绍:
Google Colab,或称为Colaboratory,允许您在浏览器中编写和执行Python代码,而无需任何配置。它提供了免费的GPU资源,方便共享和协作。

这个交互式环境允许您创建Colab笔记本,将可执行的代码与丰富的文本、图像、HTML、LaTeX等内容结合在一个文档中。您创建的Colab笔记本将存储在您的Google Drive账户中,您可以轻松地与同事或朋友共享,让他们对您的笔记本进行评论甚至编辑。此外,Colab还支持Jupyter笔记本,方便数据科学家使用流行的Python库进行数据分析和可视化.

以下是一些Colab的特点和用途:

  1. 免费GPU资源:您可以在Colab中免费使用GPU,加速模型训练和数据处理。
  2. 易于共享:您可以将Colab笔记本与他人共享,方便协作和反馈。
  3. 代码历史记录:Colab具有修订历史功能,可以查看笔记本文件的历史更改。
  4. 与Google Drive集成:Colab与Google Drive集成,方便存储和管理笔记本。

总之,Google Colab是一个强大的工具,适用于各种数据科学和机器学习任务。.

开始敲例子

简单介绍

Hugging Face的Transformers库是一个开源的机器学习库,专注于自然语言处理(NLP),它提供了许多预训练模型,用于处理文本、音频、图像和多模态任务。这些模型可以应用于文本分类、信息提取、问答、摘要、翻译和文本生成等任务。Transformers支持多种深度学习框架,包括PyTorch、TensorFlow和JAX¹²。

Transformers库的特点包括:

  • 易于使用:提供了简单的API来下载、使用、训练和共享模型。
  • 灵活性:每个定义架构的Python模块都是完全独立的,可以快速进行研究实验。
  • 多模态能力:除了文本,还可以处理图像和音频任务,甚至是多模态的组合任务。

此外,Hugging Face还提供了一个模型中心,用户可以在那里找到和共享各种模型,以及一个在线演示平台,可以直接在网页上测试大多数模型¹。如果你对NLP领域感兴趣,Hugging Face的Transformers库是一个非常有价值的资源。🤗

第一个例子-情感分析

from transformers import pipeline

# 创建一个情感分析的pipeline
classifier = pipeline('sentiment-analysis')

# 使用pipeline对文本进行情感分析
result = classifier("I've been waiting for a HuggingFace course my whole life.")

# 打印结果
print(result)

第二个例子-文本生成

from transformers import pipeline

generator= pipeline("text-generation",model="distilgpt2")

res=generator(
    'We are very happy to show you the 🤗 Transformers library.',
    max_length=40,
    num_return_sequences=5,
)

print(res)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/522031.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

精品丨PowerBI负载测试和容量规划

当选择Power BI作为业务报表平台时,如何判断许可证的选择是否符合业务需求,价格占了主导因素。 Power BI的定价是基于SKU和服务器内核决定的,但是很多IT的负责人都不确定自己公司业务具体需要多少。 不幸的是,Power BI的容量和预期…

HiveSQL如何生成连续日期剖析

HiveSQL如何生成连续日期剖析 情景假设: 有一结果表,表中有start_dt和end_dt两个字段,,想要根据开始和结束时间生成连续日期的多条数据,应该怎么做?直接上结果sql。(为了便于演示和测试这里通过…

golang slice总结

目录 概述 一、什么是slice 二、slice的声明 三、slice的初始化、创建 make方式创建 创建一个包含指定长度的切片 创建一个指定长度和容量的切片 创建一个空切片 创建一个长度和容量都为 0 的切片 new方式创建 短声明初始化切片 通过一个数组来创建切片 声明一个 …

C++可变参数模板

可变参数模板 一个可变参数模板就是一个接受可变数目参数的模板函数或模板类。 可变数目的参数被称为参数包。 存在两种参数包: 模板参数类,表示零个或多个模板参数;函数参数包,表示零个或多个函数参数。 我们用一个省略号来…

雷弗流体创新技术装备与您与您相约2024第13届生物发酵展

参展企业介绍 保定雷弗流体科技有限公司于2010年1月成立。为创新型企业,荣获国家级高新技术企业、国家级专精特新小巨人企业、河北省单项冠军企业、组织部巨人计划创业团队等荣誉称号。 保定雷弗流体科技有限公司现有职工180人,其中工程技术人员53人。现…

GitHub入门与实践

ISBN: 978-7-115-39409-5 作者:【日】大塚弘记 译者:支鹏浩、刘斌 页数:255页 阅读时间:2023-08-05 推荐指数:★★★★★ 好久之前读完的了,一直没有写笔记。 这本入门Git的书籍还是非常推荐的,…

【服务器部署篇】Linux下安装Docker容器

作者介绍:本人笔名姑苏老陈,从事JAVA开发工作十多年了,带过大学刚毕业的实习生,也带过技术团队。最近有个朋友的表弟,马上要大学毕业了,想从事JAVA开发工作,但不知道从何处入手。于是&#xff0…

X服务器远程连接问题解决:Bad displayname ““‘或Missing X server or $DISPLAY

X服务器远程连接问题 报错1 ImportError: this platform is not supported: (failed to acquire X connection: Bad displayname "", DisplayNameError()) Try one of the following resolutions: * Please make surethat you have an X server running, and that …

基于无线物联网的智能配电监控系统设计应用

摘要:阐述基于电力物联网的智能配电监控系统的特点,探讨物联网结构及其关键技术,电力物联网下的智能配电监控系统设计,包括整体结构设计、硬件和软件系统设计。 安科瑞薛瑶瑶18701709087 关键词:电力物联网&#xff…

AI水下颜色校正解决方案,助力企业打造水下视觉盛宴

水下摄影作为一种独特且富有挑战性的拍摄方式,正受到越来越多旅行者和摄影师的青睐。然而由于海水的光线折射和金属成分的影响,水下拍摄的照片和视频往往存在严重的偏色问题,无法真实还原水下世界的美丽与神奇。美摄科技凭借深厚的技术积累和…

【动态规划】【01背包】Leetcode 416. 分割等和子集

【动态规划】【01背包】Leetcode 416. 分割等和子集 ---------------🎈🎈416. 分割等和子集 题目链接🎈🎈------------------- 给你一个 只包含正整数 的 非空 数组 nums 。请你判断是否可以将这个数组分割成两个子集&#xff0…

顺序表的应用之通讯录

学习了顺序表之后,我们也得知道它的实际用途吧!所以,我们今天来学习一下通讯录的实现。 typedef struct personInfo SLDataType; contact.h #define NAME_MAX 20 #define GENDER_MAX 20 #define GTEL_MAX 20 #define ADDR_MAX 100 #include&…

芯课堂 | JScope虚拟示波器使用说明

​1. 首先需要安装Jlink的驱动,即安装JLink_Windows_V634e之后才能安装JScope,一般这个能正常使用Jlink下载、仿真说明你的Jlink驱动已经正常安装 2. 需要安装Jscope,即安装Setup_JScope_V611m,安装完成之后能看到以下画面 3. 新建…

ip地址电脑哪里看?一文揭秘

在数字化和网络化的今天,IP地址对于电脑用户而言具有至关重要的意义。无论是进行网络配置、故障排除还是安全管理,了解如何查看电脑的IP地址都是一项必备技能。虎观代理将深入解析IP地址的概念,详细指导用户如何在电脑上查看IP地址&#xff0…

红黑树插入机制深度剖析与实践指南

红黑树插入机制深度剖析与实践指南 一、红黑树的基本概念二、插入操作的初步2.1 RB-INSERT-FIXUP过程2.2 循环的不变性2.2.1 情况1:叔节点是红色2.2.2情况2和情况3:叔节点是黑色 三、插入操作的复杂性分析四、伪代码4.1 RB-INSERT 过程4.2 RB-INSERT-FIX…

angular—mooc课学习笔记

1.angular工程目录 2.设置标签元素样式 3.fex布局 4.事件绑定 5. 双向数据传输 6. 键盘实现方法

新生儿斜视:早期发现与关爱的重要性

引言: 新生儿斜视是一种常见的眼睛问题,如果不及时发现和治疗,可能会影响宝宝的视觉发展。因此,家长们需要重视并及时关注宝宝眼睛的情况,以便及早发现并处理斜视问题。在本文中,我们将探讨新生儿斜视的注意…

蓝桥杯刷题 前缀和与差分-[NewOJ P1819]推箱子(C++)

题目描述 在一个高度为H的箱子前方,有一个长和高为N的障碍物。 障碍物的每一列存在一个连续的缺口,第i列的缺口从第l各单位到第h个单位(从底部由0开始数)。 现在请你清理出一条高度为H的通道,使得箱子可以直接推出去。…

蓝桥杯刷题-09-三国游戏-贪心⭐⭐⭐

蓝桥杯2023年第十四届省赛真题-三国游戏 小蓝正在玩一款游戏。游戏中魏蜀吴三个国家各自拥有一定数量的士兵X, Y, Z (一开始可以认为都为 0 )。游戏有 n 个可能会发生的事件,每个事件之间相互独立且最多只会发生一次,当第 i 个事件发生时会分别让 X, Y,…

GitHub突破1000星!上交、清华开源个性化联邦学习算法库PFLlib

©PaperWeekly 原创 作者 | 张剑清 单位 | 上海交通大学、清华大学(AIR) 研究方向 | 联邦学习 我们在 GitHub 上开源了一个个性化联邦学习算法仓库(PFLlib),目前已经获得 1K 个 Star 和 200 个 Fork,在…