Hot Sale | 澳鹏精品数据集火热来袭!

在人工智能项目需要快速启动时,成品数据集(OTS / off-the-shelf datasets)往往是许多AI团队的首选。

采用高质量、合规的成品数据集进行部署,不仅能够在速度至关重要的今天快人一步进入市场,更可以在预算有限的情况下获得较高的成本效益。

澳鹏提供700+个成品数据集,包括27,600+小时音频、490,000+幅图像和超过一亿字/词文本,涵盖80+种语言和方言。我们也在不断构建新的数据集,以满足全球企业用户的部署需求。

▲专家团队,大规模、高质量的数据供给

▲快速部署,低成本高效益

▲支持所有数据类型

本月,澳鹏Appen精选了metadata信息齐全、数据说明完整、数据量级大、质量高的hot精品数据库限时优惠促销,包括:

22个ASR精品库,9个图片精品库,24个文本精品库,17个词典精品库,8个TTS精品库和8个视频精品库。质检合格率达95%以上。

ASR精品库

澳鹏Appen拥有170+个ASR数据产品,涵盖50+种语言,总长2万+小时。ASR精品库包含多个热门小语种、方言对话&朗读数据库,以及婴儿哭闹、猫狗吠叫、广播等特色语音数据。话题广泛涵盖各个细分领域。

  • 70小时 婴儿哭声数据库
  • 猫狗叫声(猫35H  狗35H)
  • 德语(德国)对话数据库
  • 法语(加拿大)有定稿的对话数据库
  • 法语(法国)对话数据库
  • 高保真儿童唤醒词-车载领域
  • 高保真儿童唤醒词-智能家居领域
  • 普通话(中国)会议演讲语音数据库
  • 1000小时 泰语电话信道
  • 西班牙语(西班牙)对话数据库
  • 意大利语对话数据库
  • 印地语(印度)有定稿的对话数据库
  • 250小时 印尼语朗读数据库
  • 300小时 印尼语对话数据库
  • 英文(印度)有定稿的电话录音语料库
  • 英语(英国)对话式的电话录音语料库
  • 1000小时 英语(美国)对话式的智能手机录音语料库
  • 1196小时 英语(美国)超高音量标注语音
  • 粤语对话数据库
  • 东北方言对话数据库
  • 武汉方言对话数据库
  • 四川方言唤醒词朗读

图片精品库

澳鹏拥有量级高达50万+的图像数据。图片精品库包含小语种OCR图像数据库,涵盖广告、看板、商务菜单等热门图片主题;亦包含汽车尾灯、户型图、发丝分割、50亿图文数据对(56TB)Laion 5B等小众宝藏数据集。

  • 车尾灯数据库
  • 韩语OCR数据库
  • 港澳OCR数据库
  • 阿拉伯图片数据库
  • 日语OCR发票数据库
  • 开源数据爬取(parquet文件)
  • 户型图数据库
  • 越南语图片数据
  • 发丝分割数据库

文本精品库

重点推荐超过180万词条的大语言模型训练数据库;百万量级的多领域论文数据库;数百万对平行语料库等。量级高达30万+题目的多学科试题库已达到考点全覆盖。JSON等多种可编辑的文件格式方便多渠道查看和使用。

  • 初高中英语题
  • 初高中语文题
  • 初高中化学题
  • 初高中历史题
  • 初高中生物题
  • 初高中物理题
  • 初高中地理题
  • 初高中政治题
  • 数学题库(小学1484份试卷   约23990题;初中1082份试卷 约11990题;高中份338试卷 约3990题)
  • 中英平行语料对数据库
  • 闽南语-普通话语料对数据库
  • 多音字数据库(303字,704个读音)
  • 英缅平行语料对数据库
  • 英马平行语料对数据库
  • 英菲平行语料对数据库
  • 英泰米尔语平行语料对数据库
  • 英越平行语料对数据库
  • 英文&中文-金融论文
  • LLM预训练数据集-中文百科
  • LLM垂类数据集-金融财报
  • LLM预训练数据集-新闻博客
  • 英文医学论文
  • 人体微小活动能源消耗数据采集
  • 医药|医学领域国际语料对数据库

词典精品库

澳鹏Appen自主编写制作的词典数据库覆盖超过20个语种,每个语种涵盖不同区域口音的数据。词典数据库使用说明完备,经过多次实际项目的验证评估,无论在量级还是质量方面都具备优势。

  • 丹麦(丹麦)发音词典
  • 英语(澳大利亚)发音词典
  • 英语(英国)发音词典
  • 英语(美国)发音词典
  • 法语(法国)发音词典
  • 德语(德国)发音词典
  • 意大利文(意大利)发音词典
  • 日语(日本)发音词典
  • 韩文(韩国)发音词典
  • 挪威语(挪威)发音词典
  • 葡萄牙语(巴西)发音词典
  • 葡萄牙语(葡萄牙)发音词典
  • 俄罗斯(Russia)发音词典
  • 西班牙文(西班牙)发音词典
  • 瑞典文(瑞典)发音词典
  • 泰米尔文(印度)发音词典
  • 土耳其语(土耳其)发音词典

TTS精品库

包含泰语不同年龄段、多种情绪TTS库;美语歌曲数据库;俄语、德语、美语多种音色库;中文客服女声库等等。每一个TTS数据集产品都拥有独特的风格,且均由专业录音人员使用高保真设备录制,确保数据的高质量。

  • 泰语-不同年龄段、多种情绪TTS
  • 80首美语歌曲
  • 美语成熟性感女TTS
  • 美语温柔文静女TTS
  • 西班牙文(西班牙)有定稿的麦克风录音语料库
  • 意大利文(意大利)有定稿的麦克风录音语料库
  • 中文女声(客服类)
  • 俄语德语女声TTS

视频精品库

包含当前热门的人物朗读视频数据集,涵盖东南亚五国(越南、菲律宾、马来、印尼、泰国),人均录制时长达20+分钟。此外,人物行走动态视频、宠物婴儿双模OMS数据库等产品也具有较高热度。

  • 人物行走动态视频
  • 越南朗读视频   1080P
  • 菲律宾朗读视频   1080P
  • 泰国朗读视频   1080P
  • 印尼朗读视频   1080P
  • 马来朗读视频   1080P
  • 喉结视频数据库
  • 宠物婴儿双模OMS数据库

澳鹏appen

澳鹏Appen是全球图像、文本、语音、音频、视频等AI训练数据服务提供商,拥有业内先进的人工智能辅助数据标注平台、自研的大模型开发平台及全球100多万名技能娴熟的众包资源,支持290+种语言和方言。澳鹏Appen数据解决方案已助力全球15,000+个AI项目的研发及商业化。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/705908.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【秋招突围】2024届秋招笔试-阿里系列笔试题-第一套-三语言题解(Java/Cpp/Python)

🍭 大家好这里是清隆学长 ,一枚热爱算法的程序员 ✨ 本系计划跟新各公司春秋招的笔试题 💻 ACM银牌🥈| 多次AK大厂笔试 | 编程一对一辅导 👏 感谢大家的订阅➕ 和 喜欢💗 📧 清隆这边…

如何通过Outlook大附件插件,加强外发附件的安全性和管控力度?

因邮件的便捷性和普遍性,企业间业务往来通常会采取邮箱业务,沟通使用成本也比较低,但容易出现附件太大无法上传的问题。Outlook大附件插件是为解决邮件系统中附件大小限制问题而开发的一系列工具。 使用邮件发送附件时,可能会遇到…

PR插件-图层抖动弹跳缩放旋转模糊闪烁缩放抖动动作效果预设

在PR软件中制作动画的便捷工具,直接点击脚本窗口的预设即可加载到时间线,拥有如旋转、模糊、闪烁、毛刺、弹跳、缩放、抖动等预设。脚本动画可视化预览,一键使用。A handy tool to make animations in Premiere Pro. 支持Win/Mac系统&#x…

【MySQL】MySQL45讲-读书笔记

1、基础架构:一条SQL查询语句是如何执行的? 1.1 连接器 连接器负责跟客户端建立连接、获取权限、维持和管理连接。 mysql -h$ip -P$port -u$user -p输完命令之后,输入密码。 1.2 查询缓存 MySQL 拿到一个查询请求后,会先到查询缓…

代码随想录算法训练营第37天|● 56.合并区间● 738.单调递增的数字

合并区间 56. 合并区间 - 力扣&#xff08;LeetCode&#xff09; 按照左边界从小到大排序之后&#xff0c;如果 intervals[i][0] < intervals[i - 1][1] 即intervals[i]的左边界 < intervals[i - 1]的右边界&#xff0c;则一定有重叠。&#xff08;本题相邻区间也算重贴…

高考志愿填报秘籍:大学篇

选择适合自己的大学和专业&#xff0c;对广大考生来说至关重要。从某种程度上来说&#xff0c;决定了考生未来所从事的行业和发展前景。为了帮助广大考生更加科学、合理地填报志愿&#xff0c;选择适合自己的大学和专业&#xff0c;本公众号将推出如何用AI填报高考志愿专栏文章…

免费代理为什么不安全?

在数字时代&#xff0c;网络已经成为人们日常生活和商业活动中不可或缺的一部分。为了实现更广阔的业务拓展和更畅通的网络体验&#xff0c;许多人开始考虑使用代理服务器。然而&#xff0c;虽然免费代理可能听起来像是个经济实惠的选择&#xff0c;但事实上&#xff0c;它可能…

Sui Bridge在测试网上线并推出10万SUI激励计划

是一种为Sui设计的原生桥接协议&#xff0c;专门用于在Sui与其他网络之间桥接资产和数据。今天&#xff0c;Sui Bridge宣布在测试网上线。作为一种原生协议&#xff0c;Sui Bridge能够在Ethereum和Sui之间轻松且安全地转移ETH、wBTC、USDC和USDT&#xff0c;使其成为Sui基础设施…

LeNet-5训练神经网络训练

LeNet-5训练 导包 import tensorflow as tf from tensorflow.keras import layers, models, datasets, optimizers 加载Fashion-MNIST数据集 (train_images, train_labels), (test_images, test_labels) datasets.fashion_mnist.load_data() 归一化像素值到[0, 1]区间…

服务器防漏扫,主机加固方案来解决

什么是漏扫&#xff1f; 漏扫是漏洞扫描的简称。漏洞扫描是一种安全测试方法&#xff0c;用于发现计算机系统、网络或应用程序中的潜在漏洞和安全弱点。通过使用自动化工具或软件&#xff0c;漏洞扫描可以检测系统中存在的已知漏洞&#xff0c;并提供相关的报告和建议&#xf…

Matlab|基于主从博弈的智能小区代理商定价策略及电动汽车充电管理

目录 一、主要内容 二、部分代码 三、程序结果 四、下载链接 一、主要内容 主要做的是一个电动汽车充电管理和智能小区代理商动态定价的问题&#xff0c;将代理商和车主各自追求利益最大化建模为主从博弈&#xff0c;上层以代理商的充电电价作为优化变量&#xff0c;下层以…

linux配置用户

一&#xff0c;安装sudo与确保在管理员用户下 apt update apt install sudo -y 切换用户&#xff1a;密码不会显示&#xff0c;一个个输入然后回车。//图中是zfxt-->Stable用户切换 su root //root为用户名 以其他用户执行命令&#xff1a; su root ping baidu.com //su…

安装好IDEA后,就能够直接开始跑代码了吗?

我实习的第一天&#xff0c;睿哥叫我安装了IDEA&#xff0c;然后我就照做了。 之后&#xff0c;我把gitlab的代码拉下来后&#xff0c;发现好像没有编译运行的按钮&#xff0c;所以我就跑去问睿哥。睿哥当时看了看后&#xff0c;发现原来我没有安装JDK&#xff0c;他就叫我安装…

助力618!你想便宜寄快递退换货吗?

家人们&#xff0c;姐妹们&#xff0c;马上就要到618了&#xff0c;每年一到这种重要的节日&#xff0c;我们都会买买买&#xff0c;但是我们有时候买了会发现这个商品不太满意&#xff0c;我们会选择退换货&#xff0c;或者给商家邮寄回去&#xff0c;但是这个运费可真的太贵了…

ios描述文件.mobileprovision 如何查看包含的设备 udid|IPA查看是否包含设备 UDID|轻松签查看证书是否包含自己设备 UDID

前言 之前蒲公英支持上传证书查看证书有效期和包含设备 【干货】IOS苹果P12证书有效性检测 及查看证书是否包含自己的设备 【干货】IOS苹果P12证书有效性检测 及查看证书是否包含自己的设备 - 路灯IT技术博客 - 后厂村路灯 如今蒲公英下架了该功能&#xff0c;已经没有证书检…

C++--DAY7

vector容器 #include <iostream> #include <vector>using namespace std; void printVector(vector<int> &v) {//定义一个迭代器 指针vector<int>::iterator iter;//v.end&#xff08;&#xff09;是最后一个元素的下一个元素地址for(iterv.begin…

VRRP基础配置(华为)

#交换设备 VRRP基础配置 VRRP (Virtual Router Redundancy Protocol) 全称是虚拟路由规元余协议&#xff0c;它是一种容错协议。该协议通过把几台路由设备联合组成一台虚拟的路由设备&#xff0c;该虚拟路由器在本地局域网拥有唯一的一个虚拟 ID 和虚拟 IP 地址。实际上&…

【记录】ChatGLM3-6B大模型部署、微调(一):部署

ChatGLM3介绍 源码连接&#xff1a; ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的对话预训练模型。ChatGLM3-6B 是 ChatGLM3 系列中的开源模型&#xff0c;在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上&#xff0c;ChatGLM3-6B 引入了如下特性&#xf…

(几何:六边形面积)编写程序,提示用户输入六边形的边长,然后显示它的面积。

(几何:六边形面积)编写程序&#xff0c;提示用户输入六边形的边长&#xff0c;然后显示它的面积。计 算六边形面积的公式是: 这里的s就是边长。下面是一个运行示例 package myjava; import java.math.*; import java.util.Scanner; public class cy {public static void main(S…

Spring系统学习 -Spring IOC 的XML管理Bean之P命名空间、实现引入MySQL外部链接属性文件

P命名空间 在Spring框架中&#xff0c;P命名空间是一种用于简化XML配置文件中属性注入的方式。通过引入P命名空间&#xff0c;可以使用更简洁的语法来设置bean的属性值&#xff0c;而无需显式地使用<property>子元素。这使得XML配置文件更加简洁和易于阅读。 要在Sprin…