Hugging News #0717: 开源大模型榜单更新、音频 Transformers 课程完成发布!

每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息,快来看看吧!🎉 😍

重磅更新

Hugging Face 🤗 开源大模型排行榜发现异常:让我们来调查一下!🧐

17a990372b123a0b2c80626d99d478fa.png

Open LLM 排行榜是 Hugging Face 设立的一个用于评测开放大语言模型的公开榜单。最近,随着 Falcon 🦅 的发布并在 Open LLM 排行榜上疯狂屠榜,围绕这个榜单在推特上掀起了一轮热烈的讨论。讨论主要围绕排行榜上的四个评测基准其中之一: 大规模多任务语言理解(Massive Multitask Language Understanding,MMLU)基准。

社区发现头部模型 LLaMA 🦙 在 Open LLM 榜单上的 MMLU 得分比 LLaMA 论文 中宣称的数字要低很多,大家都感觉很奇怪。

因此,我们决定深入分析一下这个现象🕳🐇,看看到底是什么原因,又应该如何解决。

在这段旅程中,你将学到很多有关如何评测模型的知识,因此,如果后面你在网络上或论文中看到了相关的评测数字,相信你就会有一定的判断力了。

详细内容请看我们在 Hugging Face 公众号发布的文章:Open LLM 排行榜近况。

Hugging Face 🤗 开源大模型榜单更新啦 🔥

146422155755f5663d1eadda5a82c534.png
  • 💡更新之一:使用更新版 Harness 重新刷榜,更新得分 🆙

在 Falcon 大模型发布之后,很多人对我们开源大模型榜单上的 LLaMA 排名下降及评分进行讨论🙋在 Harness 版本更新之后,我们对所有大模型重新刷榜,目前的得分结果都是最新的!

  • 💡更新之二:更快速的推理 💨

我们现在对兼容模型使用 text - generation - inference 文本生成推理,它速度极快且无缝连接,直接让后端的速度提升了一个数量级 🤯。对于其他模型,我们使用超级棒的 accelerate 来优化并行性。

  • 💡更新之三:提高了可复制性 📄

可以在更多的位置找到你想要的信息以便复制或重现 💻 比如在 "about" 可以找到更多的指令细节;在扩展 view 里可以看到更多有关模型的信息;一如既往,所有刷榜的结果和数据也都开源在我们的 Hub 上📊

如果我们在 Hugging Face 做一个中文大模型的列表并随时更新,你觉得怎么样?🤔️

欢迎留言告诉我们你的想法和问题 🙋

社区活动

「AI 头像变装秀」活动邀请你参加!

d9a9fe30f4dafbc0614ae4648a9cce9e.jpeg

我们在小红书平台上举办的「AI 头像变装秀」活动时间已经过半,我们看到大家生成了很多很多可爱的、抖包袱的、唯美的 AI 头像,只能说大家都太优秀啦!越发觉得好像没有一个 AI 生成的头像,出门都不好意思跟人打招呼啦!

7 月 5 日至 7 月 31 日举行 Hugging Face AI 头像变装秀活动 🔥

活动介绍: 我们将分享一段 Stable Diffusion 的 Notebook 代码 🖥️ (https://hf.link/tx)(不要听到代码就头疼呀集美们,超简单的!)顺着执行这段 Notebook 代码,你将可以使用 AI 生成自己的头像,生成头像的风格不限✨

参与方式: 在使用我们提供的代码生成头像之后,请在你的小红书发布一篇笔记 📒 分享你的成果或体验,并 @Hugging Face 官方账号让我们知道。

活动时间: ⏰ 活动将在 7 月 31 日 (周一) 晚上 12 点截止,届时获赞最多的 前三名 小伙伴将获得神秘小惊喜 🎁

如果有疑问 🙋请随时私信或留言!可到小红书查看活动详情,或者在公众号后台回复「头像」加入活动群。

官方小红书账号活动链接:https://hf.link/imot4

内容更新

音频 Transformers 课程完成发布!

2449cdd790fa2ac05bf4926b4a31774b.png

我们发布了完全开源的音频 Transformers 课程,迄今为止反响非常好!🤗

Transformers 作为一种强大而多功能的深度学习架构,一次又一次地证明了自己在各种任务中的卓越表现,包括自然语言处理、计算机视觉,最近更是在音频处理领域也有不凡的表现。

在这门课程中,我们将探索如何将 Transformers 应用于音频数据。你将学习如何使用它们来处理各种音频相关的任务。无论你对语音识别、音频分类还是从文本生成语音感兴趣,Transformers 和本课程都能满足你的需求。

课程链接 🚀:https://hf.co/learn/audio-course/chapter0/introduction

我们已经完成了 7 个单元的发布:

  • 单元 1:处理音频数据 - 为处理音频奠定基础。🧱

  • 单元 2:音频应用简介 - 介绍了众多音频应用。🏃‍♂️

  • 单元 3:音频的 Transformers 架构 - 讲解了处理音频相关任务时存在的不同类型的架构和设计!⚡️

  • 单元 4:构建音乐流派分类器 - 实际操作教程,教你如何构建音频分类流程。🎶

  • 单元 5:语音识别 - 深入探索语音识别,并构建一个模型来转录会议记录

  • 单元 6:文字转语音 - 学习如何将给定的文本转换为音频输出

  • 单元 7:具体应用 - 构建真实世界的音频应用程序

完成这门课以后,你将获得使用 Transformers 处理音频数据的坚实基础,并且能够将这些技术应用到各类音频相关的任务上。

为了这次课程,我们还进行了两次线上活动,目前两次活动的回放已经发布,请通过我们的官方哔哩哔哩账号查看:
https://hf.link/bili

本期内容编辑: Shawn


以上就是本期的 Hugging News,新的一周开始了,我们一起加油!💪🎉

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/38817.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

R语言的水文、水环境模型优化技术及快速率定方法与多模型案例实践

在水利、环境、生态、机械以及航天等领域中,数学模型已经成为一种常用的技术手段。同时,为了提高模型的性能,减小模型误用带来的风险;模型的优化技术也被广泛用于模型的使用过程。模型参数的快速优化技术不但涉及到优化本身而且涉…

TCP的三次握手过程

TCP 是面向连接的协议,所以使用 TCP 前必须先建立连接,而建立连接是通过三次握手来进行的。三次握手的过程如下图: 刚开始客户端处于 closed 的状态,服务端处于 listen 状态。 第一次握手:客户端给服务端发一个 SYN 报…

Flask

简介 django是个大而全的框架,flask是一个轻量级的框架django内部为我们提供了非常多的组件:orm/session/cookie/admin/form/modelform/路由/视图/模板/中间件/分页/auth/contenttype/缓存/信号/多数据库连接flask框架本身没有太多的功能,路由…

【MQTT】Esp32数据上传采集:最新mqtt插件(支持掉线、真机调试错误等问题)

前言 这是我在Dcloud发布的插件-最完整Mqtt示例代码(解决掉线、真机调试错误等问题),经过整改优化和替换Mqtt的js文件使一些市场上出现的问题得以解决,至于跨端出问题,可能原因有很多,例如,合法…

Python 字典 get()函数使用详解,字典获取值

「作者主页」:士别三日wyx 「作者简介」:CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者 「推荐专栏」:小白零基础《Python入门到精通》 get函数使用详解 1、设置默认返回值2、嵌套字典取值3、get() 和 dict[key] 的区别…

长短期记忆网络(LSTM)原理解析

长短期记忆网络(Long Short-Term Memory,简称LSTM)是一种常用于处理序列数据的深度学习模型。它在循环神经网络(Recurrent Neural Network,RNN)的基础上进行了改进,旨在解决传统RNN中的梯度消失…

myAgv的slam算法学习以及动态避障下篇

引言 在之前的一篇文章中有提到购入了一台myAGV,以树莓派4B为控制核心的移动机器人。上篇文章中向大家介绍了myAGV如何实现建图、导航以及静态避障,但我们深知,这只是机器人自主导航能力的基础。在实际应用场景中,机器人需要面对复…

Segment Tree 线段树算法(java)

线段树算法 Segment Tree 线段树算法代码演示 蓄水池算法 Segment Tree 线段树算法 什么是线段树算法: 线段树(Segment Tree)是一种基于树结构的数据结构,用于解决区间查询问题,例如区间最大值、最小值、区间和等。线段…

Learning Enriched Features for Fast Image Restoration and Enhancement 论文阅读笔记

这是2022年TPAMI上发表的大名鼎鼎的MIRNetv2,是一个通用的图像修复和图像质量增强模型,核心是一个多尺度的网络 网络结构整体是残差的递归,不断把残差展开可以看到是一些残差块的堆叠。核心是多尺度的MRB。网络用的损失函数朴实无华&#x…

Vue电商项目--登录与注册

登录注册静态组件 刚刚报了一个错误,找不到图片的资源 assets文件夹--放置全部组件共用静态资源 在样式当中也可以使用符号【src别名】。切记在前面加上 注册业务上 先修改原先的接口成这个按钮 然后把input框里面的数据保存到data中 注册业务下 就是点击获…

1. HTML5的新特性

HTML5的新增特性主要是针对于以前的不足, 增了一些新的标签、新的表单和新的表单属性等。 这些新特性都有兼容性问题,基本是IE9以上版本的浏览器才支持, 如果不考虑兼容性问题,可以大量使用这些新特性。 1.1 HTML5 新增的语义化标签 ●<header> : 头部标签 ●<nav&…

什么是Heatmap(热图)图表?用DHTMLX可实现快速构建

DHTMLX Chart是DHTMLX最新发布的JavaScript UI小部件库的核心内容之一&#xff0c;这个图表小部件收到了几个重要的更新&#xff0c;但其中最引人注目的是一个新的数据可视化选项——日历热图。 DHTMLX专注于JavaScript和HTML5 UI小部件和库&#xff0c;以帮助开发人员更快地构…

爬虫相关知识与面试题目

常见的反爬虫和应对方法 参考:https://www.cnblogs.com/bsdr/p/5151891.html 0x01 常见的反爬虫 这几天在爬一个网站&#xff0c;网站做了很多反爬虫工作&#xff0c;爬起来有些艰难&#xff0c;花了一些时间才绕过反爬虫。在这里把我写爬虫以来遇到的各种反爬虫策略和应对的…

python selenium.webdriver 爬取政策文件

文章目录 获取文章链接批量爬取政策文件应用selenium爬取文件信息数据处理导出为excel 获取文章链接 获取中央人民政府网站链接&#xff0c;进入国务院政策文件库&#xff0c;分为国务院文件和部门文件&#xff08;发改委、工信部、交通运输部、市场监督局、商务部等&#xff…

uni.app开发小程序如何获取当前经纬度、位置信息以及如何重新发起授权定位

uni.app开发小程序如何获取当前经纬度、位置信息以及如何重新发起授权定位 前提 先去微信小程序后台申请 wx.getLocation接口1.引入下载的高德小程序SDK2.data中定义所需变量3.onLoad中获取实例 并调用获取经纬度 位置方法4.定义获取定位经纬度 位置信息方法5.用户拒绝授权后,可…

架构训练营学习笔记3-5:消息队列备选架构设计实战

本文属于架构训练营学习笔记系列&#xff1a;模块3的案例讲解 总的来说&#xff0c;这篇从更高的维度去讲&#xff0c;而不是关注消息队列的常见问题&#xff1a;比如消息如何发送&#xff0c;消息如何不丢失 &#xff0c;消息如何不重复。总体上分为2部分&#xff1a;利益干系…

数据可视化:揭开数据的视觉奇迹

随着大数据时代的到来&#xff0c;我们面临着海量的数据&#xff0c;如何从中获取有价值的信息成为一项重要的挑战。数据可视化作为一种强大的工具&#xff0c;通过图表、图形和交互界面&#xff0c;将数据转化为可视化的形式&#xff0c;帮助我们更好地理解和分析数据。 数据可…

用OpenCV进行图像分割--进阶篇

1. 引言 大家好&#xff0c;我的图像处理爱好者们&#xff01; 在上一篇幅中&#xff0c;我们简单介绍了图像分割领域中的基础知识&#xff0c;包含基于固定阈值的分割和基于OSTU的分割算法。这一次&#xff0c;我们将通过介绍基于色度的分割来进一步巩固大家的基础知识。 闲…

kafka(一)

一&#xff1a;kafka架构介绍 1. Brokers kafka集群包括一个或者多个服务器&#xff0c;服务器的节点叫做broker。 2. Topic 类似于数据库中的table。物理上不通的topic会分开存储。一个topic的消息会存储在多个broker上。但是在读取的时候&#xff0c;只要选择好topic&…

autok3s k3d rancher研究

参考 功能介绍 | Rancher文档AutoK3s 是用于简化 K3s 集群管理的轻量级工具&#xff0c;您可以使用 AutoK3s 在任何地方运行 K3s 服务。http://docs.rancher.cn/docs/k3s/autok3s/_index 什么是 AutoK3s k3s是经过完全认证的 Kubernetes 产品&#xff0c;在某些情况下可以替…