年龄性别预测1:年龄性别数据集说明(含下载地址)

年龄性别预测1:年龄性别数据集说明(含下载地址)

目录

年龄性别预测1:年龄性别数据集说明(含下载地址)

1.前言

2.MegaAge_Asian

3.MORPH

4.IMDB-WIKI

5.数据集下载

6.年龄性别预测和识别(Python/C++/Android) 


1.前言

本项目将实现年龄性别预测和识别,整套方案采用二阶段方法实现,即首先使用通用的人脸检测算法(Face Detection)定位人脸区域,裁剪人脸,再构建多任务模型,分别进行年龄预测(Age)和性别识别(Gender)。项目分为数据集说明,Pytorch模型训练和C++/Android部署等多个章节,本篇是项目《年龄性别预测》系列文章之年龄性别数据集说明;为了方便后续模型工程化和Android平台部署,项目骨干网络backbone支持resnet18/resnet50,以及轻量化模型MobilenetV2模型训练和测试,并提供Python/C++/Android多个版本;

本篇,主要分享年龄性别人脸数据集,主要介绍MegaAge_Asian,MORPH以及IMDB-WIKI三大数据集,总数约28W+的人脸图片,并且都标注了年龄和性别的信息,可以用于龄性别预测和识别模型的开发。

 【尊重原创,转载请注明出处】https://blog.csdn.net/guyuealian/article/details/135127124


更多项目《年龄性别预测》和《面部表情识别》系列文章请参考:

  1. 面部表情识别1:表情识别数据集(含下载链接)
  2. 面部表情识别2:Pytorch实现表情识别(含表情识别数据集和训练代码)
  3. 面部表情识别3:Android实现表情识别(含源码,可实时检测)
  4. 面部表情识别4:C++实现表情识别(含源码,可实时检测)
  5. 年龄性别预测1:年龄性别数据集说明(含下载地址)
  6. 年龄性别预测2:Pytorch实现年龄性别预测和识别(含训练代码和数据)
  7. 年龄性别预测3:Android实现年龄性别预测和识别(含源码,可实时预测)
  8. 年龄性别预测4:C/C++实现年龄性别预测和识别(含源码,可实时预测)


2.MegaAge_Asian

数据说明:Quantifying Facial Age by Posterior of Age Comparisons

MegaAge_Asian一个是亚洲人脸数据集,标注了年龄和性别标签,年龄分布为0-70岁,其中训练集37563,测试集3583;项目对该数据集进行数据清洗,标注格式统一转换为

  • 数据格式:image_path age gender xmin ymin xmax ymax,如
test/287.jpg 8 0 41 64 124 180
test/135.jpg 1 1 39 74 125 182
test/1446.jpg 26 1 40 74 131 181
test/599.jpg 11 1 65 81 147 176
  • image_path是图片的相对路径
  • age是年龄,
  • gender是性别,0表示女性,1表示男性
  • xmin ymin xmax ymax对应的人脸框位置

3.MORPH

数据说明:MORPH | UNCW

MORPH一个是欧美人脸数据集,标注了年龄和性别标签,包含 2003 年至 2007 年底超过 13,000 个人的 55,000 张独特图像。年龄范围从 16 岁到 77 岁,中位年龄为 33 岁。每个人的平均图像数量为 4 张,照片之间的平均时间为 164天,最短1天,最长1681天。 图像之间的天数标准差为 180。项目对该数据集进行数据清洗,最后整理保留了训练数据49096张图片,测试数据3000张图片,标注格式统一转换为:

  • 数据格式:image_path age gender xmin ymin xmax ymax

4.IMDB-WIKI

数据说明:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/

IMDB-WIKI人脸数据集是基于IMDB 和 Wikipedia 两大数据库整合的人脸数据集,其中 IMDB 数据库包含 460,723 张人脸图片,Wikipedia 数据库包含 62,328 张人脸图片,共计 523,051 张人脸图片,该数据库中每张图片都被标注年龄和性别,但很可惜,标注质量差强人意,年龄信息标注不精准,性别信息也存在标注错误的情况,勉强凑合用吧。官网也强调MDB-WIKI数据并不能保证年龄信息的准确性。

为提高IMDB-WIKI数据的质量,项目对该数据集进行了大规模的清洗,数据清洗完后,Wikipedia 数据训练数据43590张图片,测试数据3000张图片,清洗后的数据称为wiki_crop;IMDB数据清洗完后,训练数据158868张图片,测试数据10000张图片,清洗后的数据称为imdb_crop,标注格式统一转换为:

  • 数据格式:image_path age gender xmin ymin xmax ymax

尽管,项目已经对该数据进行了清洗,但依然无法保证该数据的质量,实际项目开发中,还请谨慎使用。


5.数据集下载

数据集下载地址:可公众号【AI吃大瓜】咨询联系

内容包含:

  1. MegaAge_Asian亚洲人脸数据集,标注了年龄和性别标签,其中训练集37563,测试集3583
  2. MORPH欧美人脸数据集,标注了年龄和性别标签,训练数据49096张图片,测试数据3000张图片
  3. IMDB-WIKI欧美人脸数据集,标注了年龄和性别标签,其中wiki_crop训练数据43590张图片,测试数据3000张图片;imdb_crop训练数据158868张图片,测试数据10000张图片
  4. 标注格式统一转换为:image_path age gender xmin ymin xmax ymax

6.年龄性别预测和识别(Python/C++/Android) 

  1.  年龄性别预测1:年龄性别数据集说明(含下载地址)https://blog.csdn.net/guyuealian/article/details/135127124
  2. 年龄性别预测2:Pytorch实现年龄性别预测和识别(含训练代码和数据)https://blog.csdn.net/guyuealian/article/details/135556789
  3. 年龄性别预测3:Android实现年龄性别预测和识别(含源码,可实时预测)https://blog.csdn.net/guyuealian/article/details/135556824
  4. 年龄性别预测4:C/C++实现年龄性别预测和识别(含源码,可实时预测)https://blog.csdn.net/guyuealian/article/details/135556843

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/332107.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

『 C++ 』红黑树RBTree详解 ( 万字 )

文章目录 🦖 红黑树概念🦖 红黑树节点的定义🦖 红黑树的插入🦖 数据插入后的调整🦕 情况一:ucnle存在且为红🦕 情况二:uncle不存在或uncle存在且为黑🦕 插入函数代码段(参考)🦕 旋转…

【C++入门】C++ STL中string常用函数用法总结

目录 前言 1. string使用 2. string的常见构造 3. string类对象的访问及遍历 迭代器遍历: 访问: 4. string类对象的容量操作 4.1 size和length 4.2 clear、empty和capacity 4.3 reserve和resize reserve resize 5. string类对象的修改操作 push_back o…

version-polling一款用于实时检测 web 应用更新的 JavaScript 库

为了解决后端部署之后,如何通知用户系统有新版本,并引导用户刷新页面以加载最新资源的问题。 实现原理 1.使用 Web Worker API 在浏览器后台轮询请求页面,不会影响主线程运行。 2.命中协商缓存,对比本地和服务器请求响应头etag字…

施耐德PLCTM200CE 如何实现远程上传下载程序?

准备工作 一台可联网操作的电脑一台单网口的远程透传网关及博达远程透传配置工具网线一条,用于实现网络连接和连接PLC一台施耐德TM200CE PLC及其编程软件一张4G卡或WIFI天线实现通讯(使用4G联网则插入4G SIM卡,WIFI联网则将WIFI天线插入USB口&#xff0…

Unity3D和three.js的比较

一、Unity3D和three.js简介 Unity3D是一款跨平台的游戏引擎,可以用于开发2D和3D游戏。它提供了一个可视化的开发环境,包含了强大的编辑器和工具,使开发者可以方便地创建游戏场景、添加物体、设置物理效果、编写脚本等。Unity3D支持多种平台,包括PC、移动设备、主机等,可以…

HBuilder 创建的 Uui-App项目 如何发布到微信小程序

需提前准备的工具:HBuilder X ,微信开发者工具 目录 一、微信小程序账号申请 二、在微信开发者工具中打开服务端口 三、 在HBuilder创建Uni-App项目,并与微信小程序开发工具进行交互预览测试 四、 发布Uni-App项目 五、 微信线上发布运行 …

PXE和kickstart无人值守安装

PXE高效批量网络装机 引言 1.系统装机的引导方式 启动 操作 系统 1.硬盘 2.光驱(u盘) 3.网络启动 pxe 重装系统? 在已有操作系统 新到货了一台服务器, 装操作系统 系统镜像 u盘 光盘 pe: 小型的 操作系统 在操…

(一)SpringBoot3---尚硅谷总结

示例Demo: 1、我们先来创建一个空工程: 2、我们通过Maven来创建一个Module: JDK版本需要选择17以及以上,如果没有的话你就下载一个: 3、让此Maven项目继承父项目: 所有的Springboot项目都必须继承自spring-boot-start…

【PS】PS设计图欣赏、学习、借鉴

【PS】PS设计图欣赏、学习、借鉴 bilibili萌新PS学习计划:PS教程全套零基础教学视频(全套81节全新版本)

编译FFmpeg4.3.1 、x264并移植到Android

1、前言 FFmpeg 既是一款音视频编解码工具,同时也是一组音视频编解码开发套件。 2、准备工作 系统:LinuxNDK:android-ndk-r21b-linux-x86_64.zipFFmpeg:ffmpeg-snapshot.tar.bz2x264:x264 3、下载NDK 在linux环境中…

window11环境安装jdk17并配置环境变量

目录 一、下载地址二、安装步骤三、环境变量配置四、环境变量配置是否成功的测试 一、下载地址 https://www.oracle.com/java/technologies/downloads/#jdk17-windows 二、安装步骤 双击已下载的 jdk-17_windows-x64_bin.exe 安装包,点击【下一步】,…

Python-基础篇-类与对象/面向对象程序设计-py脚本

面向对象基础 第一个面向对象 class Cat:def eat(self):print("小猫爱吃鱼")def drink(self):print("小猫要喝水")# 创建猫对象 tom Cat()tom.eat() tom.drink()print(tom)addr id(tom) print("%x" % addr)新建两个猫对象 class Cat:def ea…

Docker安装与启动

Docker概述 Docker是一个快速交付应用、运行应用的技术: 可以将程序及其依赖、运行环境一起打包为一个镜像,可以迁移到任意Linux操作系统运行时利用沙箱机制形成隔离容器,各个应用互不干扰启动、移除都可以通过一行命令完成,方便…

力扣精选算法100题——找到字符串中所有字母异位词(滑动窗口专题)

本题链接👉找到字符串中所有字母异位词 第一步:了解题意 给定2个字符串s和p,找到s中所有p的变位词的字串,就是p是"abc",在s串中找到与p串相等的字串,可以位置不同,但是字母必须相同,比…

ChatGPT 未来学习手册

原文:Learn ChatGPT: The Future of Learning 译者:飞龙 协议:CC BY-NC-SA 4.0 “学习 ChatGPT”是任何对人工智能在教育中的作用感兴趣的人必读的书。这本开创性的书探讨了 ChatGPT 的潜力,这是一个强大的人工智能平台&#xff0…

macOS向ntfs格式的移动硬盘写数据

最近想把日常拍摄的照片从SD存储卡中转存到闲置的移动硬盘中,但是转存的时候发现,mac只能读我硬盘里的东西,无法将数据写入到移动硬盘中,也无法删除移动硬盘的数据。后来在网上查了许久资料,终于可实现mac对移动硬盘写…

EasyX图形化学习(三)

1.帧率: 即每秒钟界面刷新次数,下面以60帧为例: 1.数据类型 clock_t: 用来保存时间的数据类型。 2.clock( ) 函数: 用于返回程序运行的时间,无需参数。 3.例子: 先定义所需帧率: const …

[linux]使用libqrencode库生成二维码数据

一、需求 要将一段数据生成为二维码&#xff0c; 二、方案 使用linux标准库&#xff0c;通过libqrencode将需要写入的信息转为二维码图片数据。 三、实现 3.1编写c文件 #include <stdio.h> #include <stdlib.h> #include <qrencode.h> int main() {QRc…

GO基础进阶篇 (十四)、Http编程

Web基础概念 web应用程序 web程序可以提供浏览器访问的程序。Web应用程序通常采用客户端-服务器模型。客户端是用户使用的Web浏览器或其他Web客户端&#xff0c;而服务器是存储和处理数据的远程计算机。 我们能访问到的任何一个页面或资源&#xff0c;都存在于世界的某一个角落…

C++大学教程(第九版)5.18进制表

目录 题目 代码 运行截图 题目 &#xff08;进制表&#xff09;编写一个程序要求打印一张表&#xff0c;内容是1~256范围内每个十进制数对应的二进制、八进制和十六进制形式。如果还不熟悉这些计数系统&#xff0c;可先阅读附录 D。提示:可以使用流操纵符dec、oct 和 hex来…