倒计时 3 天!立即预约苹果 WWDC24 直播;RLAIF-V 大规模多模态偏好数据集上线,有效减少不同 MLLMs 幻觉现象

6 月 3 日-6 月 7 日,hyper.ai 官网更新速览:

优质公共数据集:10 个

优质教程精选:2 个

社区文章精选:3 篇

热门百科词条:5 条

6-7 月截稿顶会:5 个

访问官网:hyper.ai

公共数据集精选

1. ChartQA 图表问题基准数据集

该数据集涵盖了 9.6K 个人工编写的问题,以及从人工编写的图表摘要生成的 23.1K 个问题,旨在解决涉及视觉和逻辑推理的复杂问题。

直接使用:https://go.hyper.ai/5tJE9

2. RS5M 大规模图文配对遥感数据集

RS5M 数据集包含 500 万张带有英文描述的遥感图像。这个数据集是通过使用预训练的视觉语言模型 (VLM) 筛选公开可用的图像文本配对数据集和带标签的遥感 (RS) 数据集而获得的。
直接使用:https://go.hyper.ai/jbwsV

3. CapsFusion-120M 多模态图文数据集

该数据集包含来自 LAION-2B 和 LAION-COCO 数据集的图文信息,可用于大规模多模态预训练,或进一步深入研究图像文本数据的质量。

直接使用:https://go.hyper.ai/pEE7u

4. ShareGPT4V 大规模高质量图文数据集

该数据集包含 120 万对图像-文本配对,这些数据有效地对齐了视觉和语言特征,增强了模型遵循指令的能力,并纳入了更多学术任务,例如 ScienceQA、TextVQA、SBU 等。

直接使用:https://go.hyper.ai/9CVao

5. RLAIF-V-Dataset 大规模多模态偏好数据集

RLAIF-V 数据集是一个由 AI 生成的多模态偏好数据集,它覆盖了各种任务和领域。该数据集包含超过 44,757 组高质量的对比对,用于训练和评估多模态大型语言模型。

直接使用:https://go.hyper.ai/cG6fp

6. FoodLogoDet-1500 高质量食品标识检测数据集

该数据集由 1,500 个类别、99,768 张图像和 145,400 个对象组成。这是首个最大的公开食品标识检测数据集。

直接使用:https://go.hyper.ai/eco23

7. ZSFooD 食品食物图像数据集

该数据集包含 10 个餐厅场景中收集的 20,603 张食物图像,每个场景中都有多个用边界框标注的食物对象,由 95,322 个边界框和 291 个类组成。

直接使用:https://go.hyper.ai/6xrrC

8. Food-1K 食品图像数据集

该数据集包含超过 1,000 个细粒度食品类别和超过 50 万张图像,被 ICCV 2021 用于 Workshop LargeFineFoodAI 大规模细粒度食品分析竞赛。

直接使用:https://go.hyper.ai/sjZJi

9. ISIA Ingredient-201 食材图像数据集

该数据集中有 201 个子类,涵盖了现有食材类别的常见类型。食材图像收集在 5 个与食材相关的场景中,每个场景至少收集了 150 个食材类别。

直接使用:https://go.hyper.ai/bGe45

10. ISIA Food-500 食品菜肴数据集

该数据集包含 399,726 个食品项目,共有 500 多种菜肴。每一项都包含食物名称、食物图片。

直接使用:https://go.hyper.ai/yqco5

更多公共数据集,请访问:

https://hyper.ai/datasets

公共教程精选

1. ComfyUI DynamiCrafter教程|颠覆AI视频生成!分分钟实现图转视频,细节也能完美调整

由香港中文大学、腾讯 AI Lab 等推出的 DynamiCrafter 模型利用视频扩散技术模拟真实世界的运动模式,结合文本指令,即可将图片转换为动态视频。该教程为大家搭建好了 ComfyUI 工作流环境,不用担心节点连接错误,仅需上传图片并输入文本即可操作!

在线运行:https://go.hyper.ai/PWzJR

2. 别等了!速来体验 GLM-4-9B-Chat Demo

本周,智谱 AI 发布了基座大模型 GLM-4 的最新开源成果——GLM-4-9B,首次拥有了多模态能力。为了让大家第一时间体验到这个自称「超越 Llama3-8B」的开源模型,超神经上线了「GLM-4-9B-Chat Demo」教程。无需输入任何命令、点击克隆即可立即开始体验 GLM-4-9B-Chat 的卓越性能。

在线运行:https://go.hyper.ai/hc5OK

社区文章精选

1. 无实验数据指导蛋白质定向进化,上海交大洪亮课题组发表微环境感知图神经网络 ProtLGN

上海交通大学洪亮课题组提出了 PROTLGN 微环境感知图神经网络,能够从蛋白质三维结构中学习并预测有益的氨基酸突变位点,指导具有不同功能蛋白质单位点突变和多位点突变设计,超 40% 的 PROTLGN 设计单点突变体蛋白质优于其野生型对应物。相关成果已发表在「JCM」。

查看完整报道:https://go.hyper.ai/6FkFu

2. 重塑锂电池性能边界,武汉理工大学康健强团队,基于集成学习提出简化电化学模型

武汉理工大学康健强团队提出了一种集成学习 (ELM) + FIE 的简化电化学模型模型。ELM 精准预测了固相电极的锂离子浓度,比单个模型实现更准确的电压预测,其计算复杂度也远远低于 P2D 模型。FIE 精准预测了正负极集流附近电解质中的锂离子浓度。

查看完整报道:https://go.hyper.ai/CWvce

3. 微电子加速迈向后摩尔时代!复旦大学梅永丰课题组集成 DNN 与纳米薄膜技术,精准分析入射光角度

复旦大学材料科学系梅永丰教授课题组提出了一种多级准静态有限元分析法,并设计构筑了六类硅/铬纳米薄膜组装三维微结构及相应的三维光探测器,验证了该技术的良好通用性和工业实践性。相关成果已发表在「Nature」。

查看完整报道:https://go.hyper.ai/2s73Q

热门百科词条精选

1. 核范数 Nuclear Norm

2. 掩码语言建模 MLM

3. 长短期记忆 Long Short-Term Memory

4. YOLOv10 实时端到端物体检测

5. Kolmogorov-Arnold Networks

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://hyper.ai/wiki

B 站直播预告

苹果将于北京时间 6 月 11 日(下周二)举办 WWDC24,届时 HyperAI超神经视频号和 B 站将实时转播,欢迎扫码预约直播↓

为了帮助大家深入了解 Apple 的相关信息,超神经 B 站直播间将持续直播「Apple 专题」视频, 涉及:历年 WWDC 大会、高管访谈、相关纪录片等丰富内容。

下表为小编为大家精选的内容预告↓↓↓

日期时间内容
6 月 10 日星期一18:00乔布斯传
6 月 11 日星期二1:00Apple WWDC24
6 月 12 日星期三18:00是什么成就了Apple
6 月 13 日星期四18:00iPhone 首次问世发布会
6 月 14 日星期五18:00史蒂夫·乔布斯的历史
6 月 15 日星期六18:00苹果如何在几乎破产时生存下来
6 月 16 日星期日18:00蒂姆·库克的历史

超神经电视台 7×24h 不间断直播,点击即可收获 AI 领域的「电子榨菜」:

http://live.bilibili.com/26483094

6 - 7 月截稿顶会

一站式追踪人工智能学术顶会:https://hyper.ai/events

以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

下周再见!

关于 HyperAI超神经 (hyper.ai)

HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区, 致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:

  • 为 1200+ 公开数据集提供国内加速下载节点

  • 收录 300+ 经典及流行在线教程

  • 解读 100+ AI4Science 论文案例

  • 支持 500+ 相关词条查询

  • 托管国内首个完整的 Apache TVM 中文文档

访问官网开启学习之旅:

https://hyper.ai/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/687158.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

37. 【Java教程】序列化与反序列化

上一小节我们学习了 Java 的输入输出流,有了这些前置知识点,我们就可以学习 Java 的序列化了。本小节将介绍什么是序列化、什么是反序列化、序列化有什么作用,如何实现序列化与反序列化,Serializable 接口介绍,常用序列…

【JavaEE精炼宝库】多线程(4)深度理解死锁、内存可见性、volatile关键字、wait、notify

目录 一、死锁 1.1 出现死锁的常见场景: 1.2 产生死锁的后果: 1.3 如何避免死锁: 二、内存可见性 2.1 由内存可见性产生的经典案例: 2.2 volatile 关键字: 2.2.1 volatile 用法: 2.2.2 volatile 不…

C++中的stack和queue

C中的stack和queue 一丶stack1. stack的介绍2. stack的使用3. stack的模拟实现 二丶queue1. queue的介绍2. queue的使用3. queue的模拟实现 一丶stack 1. stack的介绍 stack的文档介绍 关于stack: 1. stack是一种容器适配器,专门用在具有后进先出操作的…

ROS socketcan_bridge使用说明

ROS socketcan_bridge使用说明(以ubuntu20.04为例) socketcan_bridge是什么 ROS针对socketcan提供了三个层次的驱动库,分别是ros_canopen,socketcan_bridge和socketcan_interface。 socketcan_interface: 功能&#x…

20240607在Toybrick的TB-RK3588开发板的Android12下适配IMX415摄像头和ov50c40

20240607在Toybrick的TB-RK3588开发板的Android12下适配IMX415摄像头和ov50c40 2024/6/7 11:42 【4K/8K摄像头发热量巨大,请做好散热措施,最好使用散热片鼓风机模式!】 结论:欢迎您入坑。 Toybrick的TB-RK3588开发板的技术支持不…

STM32—按键控制LED(定时器)

目录 1 、 电路构成及原理图 2 、编写实现代码 main.c exit.c 3、代码讲解 4、烧录到开发板调试、验证代码 5、检验效果 此笔记基于朗峰 STM32F103 系列全集成开发板的记录。 1 、 电路构成及原理图 EXTI(External interrupt/event controller&#xff…

机器视觉——物块分拣

项目进行到第四天,我们学到了很多,可以进行实操。 首先我们利用相机软件进行采图 然后导入代码里面 完整代码 dev_get_window (WindowHandle) list_image_files (采图, default, [], ImageFiles) for Index : 0 to |ImageFiles| - 1 by 1read_image (Im…

上BFT,是你的首选

上BFT,是你的首选 如果你想要找最智能的机器人,想要找品牌最全或者想要咨询专业的解决方案,一定不要错过BFT机器人采购站。BFT致力于为广大用户提供品质卓越、技术先进的机器人产品。 BFT里面机器人多种多样,不管您是想要工业机器…

取证工作: SysTools MailXaminer, 用强大功能辅助电子邮件调查工作的每一步

天津鸿萌科贸发展有限公司是 SysTools 系列软件的授权代理商。 SysTools MailXaminer 电子邮件取证软件将调查工作分为五个阶段:邮件加载、预览、搜索、分析及导出。软件对调查工作的每一阶段都提供了现代高级功能,以帮助数字取证调查员根据其具体要求对…

知乎知+广告推广开户充值的返点政策是怎样?

如何让您的品牌精准触达目标受众,实现高效传播与转化,成为了每一位市场人面临的挑战。为此,云衔科技作为业界领先的数字营销解决方案提供商,正式宣布全面支持知乎知广告开户及一站式代运营服务,旨在帮助各行业客户在知…

珠海鸿瑞毛利率持续下滑:核心产品销量大降,偿债能力偏弱

《港湾商业观察》黄懿 日前,珠海市鸿瑞信息技术股份有限公司(下称“珠海鸿瑞”)收到了北京证券交易所发出的第三轮审核问询函。 此前,2020年11月,珠海鸿瑞曾向深交所报送上市申请。IPO申请文件获受理后,珠…

用互斥锁解决缓存击穿

我先说一下正常的业务流程:需要查询店铺数据,我们会先从redis中查询,判断是否能命中,若命中说明redis中有需要的数据就直接返回;没有命中就需要去mysql数据库查询,在数据库中查到了就返回数据并把该数据存入…

pypi 发布自己的包

注册pypi个人用户 网址:https://pypi.org 目录结构dingtalk_utils 必须-pkgs- __init__.py .gitignore LICENSE 必须 README.md 必须 requirements.txt setup.py 必须安装依赖 pip install setuptools wheel安装上传工具 pip install twinesetup.py i…

Maxkb玩转大语言模型

Maxkb玩转大语言模型 随着国外大语言模型llama3的发布,搭建本地个人免费“人工智能”变得越来越简单,今天博主分享使用Max搭建本地的个人聊天式对话及个人本地知识域的搭建。 1.安装Maxkb开源应用 github docker快速安装 docker run -d --namemaxkb -p 8…

进入某个页面时将VUE中的某个Button按钮设置为选中状态

进入某个页面时将VUE中的某个Button按钮设置为选中状态 我想达到的效果如标题所说,目的是为了表示页面展示的内容是由于该按钮被选择的结果。 解决思路是使用VUE中的mounted()钩子函数,在该函数中调用按钮得到焦点方法、按钮被点击方法。具体代码如下&am…

Redis限流方案

限流简介 限流算法在分布式领域是一个经常被提起的话题,当系统的处理能力有限时,如何阻止计划外的请求继续对系统施压,是一个需要重视的问题。 除了控制流量,限流还有一个应用目的是用于控制用户行为,避免垃圾请求&a…

【echarts】如何制作,横坐标每个日期点如何对应一条竖线的图,以及 markline设置后不生效问题

图的样式如下: 在线演示 每一个日期,对应一条竖线展示。 echarts配置内容: 在线演示 option {xAxis: {type: category,data: [20240601, 20240602, 20240603, 20240604, 20240605, 20240606, 20240607] // X轴数据},yAxis: {type: valu…

Bond 网卡绑定技术学习

前言: 为了实现网卡的高可用性,需要学习一下 Bond技术 1. 概念 Bond(也被称为链路聚合、端口绑定或接口绑定)是一种网络技术,用于将多个物理网络接口(如以太网接口)组合成一个逻辑接口。这样做…

今日份动态规划学习

主要只搞了一个这道题,有点摸鱼了今天晚上,也是来小看一下这道题吧01背包完全背包 P1941 [NOIP2014 提高组] 飞扬的小鸟 题意: 这题是说,给我们一个游戏界面,界面的长度为n(水平距离)&#x…

E: Unable to locate package ros-kinetic-usb-cam

mkdir -p USB/src && cd USB/src catkin_init_workspace git clone https://github.com/bosch-ros-pkg/usb_cam.git cd .. catkin_make source devel/setup.bash echo "source ~/USB/devel/setup.bash" >> ~/.bashrc source ~/.bashrc 编译过程报错&…