数据集相关网站(Open datasets and sources)

数据集相关网站(Open datasets and sources)

  • 数据集网站 Open datasets and sources
    • 政府数据网站 Government Data:
    • 金融数据网站 Financial Data Sources:
    • 犯罪数据网站 Crime Data:
    • 健康数据网站 Health Data:
    • 学术和商业数据网站 Academic and Business Data:
    • 其他数据集网站Other:
  • 数据集许可证 Dataset licenses

数据集网站 Open datasets and sources

在这里插入图片描述

政府数据网站 Government Data:

  • https://www.data.gov/ — 美国政府公开数据网站
  • https://www.census.gov/data.html
  • https://data.gov.uk/ – 英国政府公开数据网站
  • https://www.opendatanetwork.com/ – 一个美国各种数据的搜索网站
  • https://data.un.org/ – 联合国公开数据,可以查看全球各个国家的人口、教育、医疗、健康、经济等多种数据。
  • https://data.stats.gov.cn/ – 中国国家统计局数据查询网站

金融数据网站 Financial Data Sources:

  • https://data.worldbank.org/ – 世界银行公开数据网站
  • https://www.globalfinancialdata.com/ – 全球金融数据网站
  • https://comtrade.un.org/ – 联合国商品贸易统计数据库
  • https://www.nber.org/ – 美国国家经济研究局
  • https://fred.stlouisfed.org/ – 美联储经济数据,可以查找美国各个地区,各个行业等多种数据。

犯罪数据网站 Crime Data:

  • https://www.fbi.gov/services/cjis/ucr – 美国联邦调查局犯罪信息数据
  • https://www.icpsr.umich.edu/icpsrweb/content/NACJD/index.html – 美国国家刑事司法数据档案馆
  • https://www.drugabuse.gov/related-topics/trends-statistics – 美国国立卫生研究院数据网站
  • https://www.unodc.org/unodc/en/data-and-analysis/ – 联合国毒品和犯罪数据网站

健康数据网站 Health Data:

  • https://www.who.int/gho/database/en/ – 全球卫生健康观察网站,有全球的卫生健康方面的数据
  • https://www.fda.gov/Food/default.htm – 美国食品和药物管理局
  • https://seer.cancer.gov/faststats/selections.php?series=cancer – 癌症相关数据,美国政府网站
  • https://www.opensciencedatacloud.org/ – 开放科学数据云网站,需要注册
  • https://pds.nasa.gov/ – NASA行星数据,大气、行星相关数据。
  • https://earthdata.nasa.gov/ – NASA地球数据,地表面积、海洋、生物圈、人口等地球层面的数据。
  • https://www.sgim.org/communities/research/dataset-compendium/public-datasets-topic-grid – 普通内科协会网站,有医学相关的各种数据

学术和商业数据网站 Academic and Business Data:

  • https://scholar.google.com/ – 谷歌学术,需要梯子
  • https://nces.ed.gov/ – 美国国家教育统计中心,需要梯子
  • https://www.glassdoor.com/research/ – 玻璃门经济研究网站,主要数据内容针对:工作、薪水、福利、公司评论、招聘、薪酬和广泛经济方面的重要趋势。
  • https://www.yelp.com/dataset – 提供企业、大都市、图片等数据资源,网站打开的有些慢,有梯子会快一些

其他数据集网站Other:

  • https://www.kaggle.com/datasets – 大家都知道

  • https://www.reddit.com/r/datasets/ – 需梯子。。

  • https://www.datacastle.cn/dataset_list.html – datacastle网站,有数据竞赛,也可以下载数据集,国内网站

  • https://tianchi.aliyun.com/dataset/ – 阿里云天池数据网站,阿里的数据科学赛事平台。

  • https://connect.huaweicloud.com/courses/learn/aiModel?resourceType=dataset – 华为云大赛,数据集下载,华为的数据赛事平台

数据集许可证 Dataset licenses

  • 选择数据集时,有必要查看许可证。许可证说明您是否可以使用该数据集;或解释您是否必须接受某些准则才能使用该数据集。下面列出了不同的许可证类型。

PUBLIC DOMAIN MARK - PUBLIC DOMAIN

  • 当数据集具有公共领域许可时,使用、访问、修改和共享数据集的所有权利均向所有人开放。从技术上讲,这里没有许可证。

OPEN DATA COMMONS PUBLIC DOMAIN DEDICATION AND LICENSE – PDDL

  • 开放数据共享许可证与公共领域许可证具有相同的功能,但不同之处在于PDDL许可证使用许可机制来授予数据集的权利。

CREATIVE COMMONS ATTRIBUTION 4.0 INTERNATIONAL CC-BY

  • 此许可证允许用户共享和修改数据集,但前提是他们向数据集的创建者提供功劳。

COMMUNITY DATA LICENSE AGREEMENT – CDLA PERMISSIVE-2.0

  • 与大多数开源许可证一样,此许可证允许用户使用、修改、改编和共享数据集,但前提是还包括免责声明和责任。

OPEN DATA COMMONS ATTRIBUTION LICENSE - ODC-BY

  • 此许可证允许用户共享和改编数据集,但前提是他们向数据集的创建者致谢。

CREATIVE COMMONS ATTRIBUTION-SHAREALIKE 4.0 INTERNATIONAL - CC-BY-SA

  • 此许可证允许用户使用、共享和改编数据集,但前提是他们授予数据集信用并显示他们对数据集所做的任何更改或转换。用户可能不想使用此许可证,因为他们必须共享他们在数据集上所做的工作。

COMMUNITY DATA LICENSE AGREEMENT – CDLA-SHARING-1.0

  • 该许可证使用“copyleft”原则:用户可以使用,修改和改编数据集,但前提是他们不对使用数据集创建的新作品添加许可证限制。

OPEN DATA COMMONS OPEN DATABASE LICENSE - ODC-ODBL

  • 此许可证允许用户使用、共享和改编数据集,但前提是他们为数据集提供信用并显示他们对数据集所做的任何更改或转换。用户可能不想使用此许可证,因为他们必须共享他们在数据集上所做的工作。

CREATIVE COMMONS ATTRIBUTION-NONCOMMERCIAL 4.0 INTERNATIONAL - CC BY-NC

  • 此许可证是限制性许可证。用户可以共享和改编数据集,前提是他们将其归功于其创建者并确保数据集不用于任何商业目的。

CREATIVE COMMONS ATTRIBUTION-NO DERIVATIVES 4.0 INTERNATIONAL - CC BY-ND

  • 此许可证也是限制性许可证。如果用户将功劳归功于数据集的创建者,则可以共享数据集。此许可不允许对数据集进行添加、转换或更改。

CREATIVE COMMONS ATTRIBUTION-NONCOMMERCIAL-SHAREALIKE 4.0 INTERNATIONAL - CC BY-NC-SA

  • 此许可证允许用户仅在将数据集的创建者归功于数据集时共享数据集。用户可以共享数据集的添加、转换或更改,但不能将数据集用于商业目的。

CREATIVE COMMONS ATTRIBUTION-NONCOMMERCIAL-NODERIVATIVES 4.0 INTERNATIONAL - CC BY-NC-ND

  • 此许可证允许用户仅在将数据集的创建者归功于数据集时共享数据集。用户不得修改数据集,也不得将其用于商业目的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/60211.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

服务器流量

1.服务器流量分为入流量和出流量 入流量(Inbound Traffic)是指流向服务器的数据流量,也就是客户端发送到服务器的数据。这些数据可能包括请求信息、文件上传等。 出流量(Outbound Traffic)是指从服务器流向客户端的数…

【数据分析】numpy (二)

numpy作为数据分析,深度学习常用的库,本篇博客我们来介绍numpy的一些进阶用法: 一,numpy的常用简单内置函数: 1.1求和: a np.array([[1, 2],[3, 4]]) np.sum(a)10 1.2求平均值: np.mean(a…

“Why Should I Trust You?” Explaining the Predictions of Any Classifier阅读笔记

“Why Should I Trust You?” Explaining the Predictions of Any Classifier阅读笔记 1. 论文贡献2. 背景 [ 1 ] ^{[1]} [1]3. LIME解释单个样本3.1 总体思想3.2 构建可解释的数据表示 [ 1 ] ^{[1]} [1]3.3 可解释性和忠实度的权衡3.4 局部采样3.5 稀疏线性解释3.6 使用SVM进…

C语言进阶第一课 -----------深度剖析数据在内存中的存储

作者前言 🎂 ✨✨✨✨✨✨🍧🍧🍧🍧🍧🍧🍧🎂 🎂 作者介绍: 🎂🎂 🎂…

组合总和 II——力扣40

文章目录 题目描述法一 回溯 题目描述 法一 回溯 class Solution{ public:vector<pair<int, int>>freq;vector<vector<int>> res;vector<int> seq;void dfs(int pos, int rest){//如果目标值为0&#xff0c;说明可能有一个组合或者rest本身为0 …

基于Java+SpringBoot+Vue的就业信息管理系统设计与实现(源码+LW+部署文档等)

博主介绍&#xff1a; 大家好&#xff0c;我是一名在Java圈混迹十余年的程序员&#xff0c;精通Java编程语言&#xff0c;同时也熟练掌握微信小程序、Python和Android等技术&#xff0c;能够为大家提供全方位的技术支持和交流。 我擅长在JavaWeb、SSH、SSM、SpringBoot等框架…

redis 集群 1:李代桃僵 —— Sentinel

目前我们讲的 Redis 还只是主从方案&#xff0c;最终一致性。读者们可思考过&#xff0c;如果主节点凌晨 3 点突发宕机怎么办&#xff1f;就坐等运维从床上爬起来&#xff0c;然后手工进行从主切换&#xff0c;再通知所有的程序把地址统统改一遍重新上线么&#xff1f;毫无疑问…

C语言第十三课--------初阶指针的认识--------重要部分

作者前言 &#x1f382; ✨✨✨✨✨✨&#x1f367;&#x1f367;&#x1f367;&#x1f367;&#x1f367;&#x1f367;&#x1f367;&#x1f382; &#x1f382; 作者介绍&#xff1a; &#x1f382;&#x1f382; &#x1f382;…

Hadoop 之 Hive 4.0.0-alpha-2 搭建(八)

Hadoop 之 Hive 搭建与使用 一.Hive 简介二.Hive 搭建1.下载2.安装1.解压并配置 HIVE2.修改 hive-site.xml3.修改 hadoop 的 core-site.xml4.启动 三.Hive 测试1.基础测试2.建库建表3.Java 连接测试1.Pom依赖2.Yarm 配置文件3.启动类4.配置类5.测试类 一.Hive 简介 Hive 是基于…

Nginx的搭建与核心配置

一、Nginx 1、Nginx概述 一款高新能、轻量级Web服务软件系统资源消耗低对HTTP并发连接的处理能力高单台物理服务器可支持30 000&#xff5e;50 000个并发请求。 2、Nginx主要功能&#xff1a; 静态文件服务&#xff1a;nginx可直接提供静态文件服务&#xff0c;HTML、CSS、J…

STM32CubeMX+VSCODE+EIDE+RT-THREAD 工程创建

Eide环境搭建暂且不表&#xff0c;后续补充。主要记录下Vscode环境下 创建Rt-thread工程的过程。分别介绍STM32CubeMX添加rtt支持包的方式和手动添加rtt kernel方式。STM32CubeMX生成工程的时候有"坑"&#xff0c;防止下次忘记&#xff0c;方便渡一下有缘人&#xff…

maven发布到中央仓库

创建账号 https://issues.sonatype.org 【第二步】登录申请新项目 右上角点击Create&#xff0c;Project选择第一项&#xff0c;有的时候带不出来第二个New Project&#xff0c;可以再选一次Project的选项。

centos7 ‘xxx‘ is not in the sudoers file...

如题 执行命令输入密码后时报错&#xff1a; [sudo] password for admin &#xff08;我的账户&#xff09;原因&#xff0c;当前用户还没有加入到root的配置文件中。 解决 vim打开配置文件&#xff0c;如下&#xff1a; #切换到root用户 su #编辑配置文件 vim /etc/sudoe…

2023软件测试面试热点300问(接口自动化测试篇)

分享100道涉及到的接口自动化测试面试题&#xff0c;供大家参考&#xff1a; 我已经把这些面试题全部整理在一个文档里面了&#xff0c;同时还有这些面试题的视频教程分享&#xff0c;全部放在文末了&#xff0c;需要的可以直接去观看&#xff0c;或者直接点击文末小卡片免费领…

路由器DHCP实验

拓扑图 配置 # 配置ip地址并开启dhcp [Huawei]int g0/0/0 [Huawei-GigabitEthernet0/0/0]ip addr 192.168.1.1 255.255.255.0 [Huawei-GigabitEthernet0/0/0]dhcp enable## 配置dns地址 [Huawei-GigabitEthernet0/0/0]dhcp dns-list 192.168.1.5## 指定某个接口开通DHCP 功能…

Zebec Payroll :计划推出 WageLink On-Demand Pay,进军薪酬发放领域

“Zebec Protocol 生态旨以 Web3 的方式建立全新的公平秩序&#xff0c;基于其流支付体系构建的薪酬支付板块&#xff0c;就是解决问题的一把利刃” Zebec Protocol 在创立之初就有着一个十分宏大的愿景&#xff0c;其希望通过 Web3 的方式来进一步打破世界上一些不公平现象。 …

【小沐学NLP】在线AI绘画网站(百度:文心一格)

文章目录 1、简介2、文心一格2.1 功能简介2.2 操作步骤2.3 使用费用2.4 若干示例2.4.1 女孩2.4.2 昙花2.4.3 山水画2.4.4 夜晚2.4.5 古诗2.4.6 二次元2.4.7 帅哥 结语 1、简介 当下&#xff0c;越来越多AI领域前沿技术争相落地&#xff0c;逐步释放出极大的产业价值&#xff0…

OpenCV之信用卡识别实战

文章目录 代码视频讲解模板匹配文件主程序(ocr_template_match.py)myutils.py 代码 链接: https://pan.baidu.com/s/1KjdiqkyYGfHk97wwgF-j3g?pwdhhkf 提取码: hhkf 视频讲解 模板匹配文件 主程序(ocr_template_match.py) # 导入工具包 from imutils import contours # 从…

【LeetCode】236.二叉树的最近公共祖先

题目 给定一个二叉树, 找到该树中两个指定节点的最近公共祖先。 百度百科中最近公共祖先的定义为&#xff1a;“对于有根树 T 的两个节点 p、q&#xff0c;最近公共祖先表示为一个节点 x&#xff0c;满足 x 是 p、q 的祖先且 x 的深度尽可能大&#xff08;一个节点也可以是它…

刷了3个月的华为OD算法题,总结了270多道,谈谈自己的感悟

目录 一、考研二战&#xff0c;入职华为&#xff0c;反向调剂电子科大深圳二、题目描述三、输入描述四、输出描述五、解题思路六、Java算法源码七、效果展示1、输入2、输出3、说明 大家好&#xff0c;我是哪吒。 最近一直在刷华为OD机试的算法题&#xff0c;坚持一天三道题的节…