政府统计中如何使用大数据

当今世界,科技进步日新月异,互联网、云计算、大数据等现代信息技术深刻改变着人类的思维、生产、生活、学习方式。信息技术与经济社会的交汇融合引发了数据爆发式增长,数据已成为重要生产要素和国家基础性战略资源。近年来,国家统计局颁布了一系列推进大数据应用的重要举措,确定了“总体设计、牵头攻关、先易后难、专业突破”的总体思路和“打造中国政府统计数据来源第二轨”的工作目标,稳步推进大数据政府统计中的应用,加快推进大数据与政府统计工作深度融合。

一、什么是大数据

大数据(Big Data)被认为是新型战略性资源,能够帮助实现对经济社会发展的全面展现、精准预测和智慧决策。当前,对大数据的概念已经基本形成共识, 尽管在某些细节上还存在一些争议。中华人民共和国原国家质量监督检验检疫总局和中国国家标准化管理委员会于 2017 年 12 月 29 日发布了《信息技术 大数据术语》的国家标准(GB/T 35295-2017),并于 2018 年 7 月 1 起正式实施。该标准指出,大数据是“具有体量大、来源多样、生成极快、且多变等特征并且难以用传统数据体系结构有效处理的包含大量数据集的数据”。这种针对信息技术领域对大数据给出的定义,可以作为其他领域的重要参考。对政府统计而言,大数据通常被认为是采用多种数据收集方式、整合多种数据来源的数据,是采用现代信息技术和架构高速处理和挖掘、具有高度应用价值和决策支持功能的数据、方法及其技术集成。

二、大数据主要有哪些特征

一般认为,大数据的主要特征可以概括为四个“V”(见右图):

大数据的主要特征
第一,数据体量巨大(Volume)。目前人类社会的数据集规模已经从 GB 到 TB 再到 PB,甚至到了以 EB 和 ZB 来进行计量的程度。

第二,应用价值巨大(Value)。大数据经过有针对性地搜集、清洗、分析后,对政府决策、企业经营和大众消费等都具有应用价值和支撑作用。大数据和传统数据如果能做到深度融合、有机结合,可能会产生新的信息和知识。运用和处理大数据就是要通过强大的机器算法迅速地完成数据的价值“提纯”。

第三,数据类型繁多(Variety)。大数据主要包括结构化数据、半结构化数据和非结构化数据, 如音频、视频、图片、网络日志、地理位置信息等多种类型的数据。非结构化数据占比很高且不断增大,对常规数据分析工具提出了较大挑战。

第四,生成速度快(Velocity)。大数据往往以数据流形式实时快速地产生。手机、物联网、平板电脑、移动互联网以及各种传感器的广泛深入应用,为提升大数据生产速度提供了便利条件。对大数据的处理需要采用非传统的技术手段, 引入新的基础架构,努力破解快速计算和实时存储相关难题。

三、政府统计应用大数据的主要类型有哪些

根据国家统计局和国家发展改革委联合印发的《非传统数据统计应用指导意见》(国统字〔2017〕160 号),大数据是非传统数据的主体,在很多情形下可以代指非传统数据。具体而言,大数据是指通过非传统政府统计调查获取的数据(国外一些机构也称之为“二手数据”),包括政府部门的行政记录数据、商业记录数据、互联网数据、电子设备感应数据以及其他大数据。大数据与传统调查数据存在以下主要差异(见下表):

在这里插入图片描述

四、我国政府统计大数据应用走在世界前列

大数据作为政府统计数据来源的“第二轨”(或新兴之轨),应用领域非常广泛,几乎覆盖数据采集、处理、存储、分析和发布等整个统计过程。近些年来,我国政府统计积极开展大数据应用,取得显著成效。在核算、工业、能源、投资、贸经、人口、社会、科技、农业、价格、住户、服务业等领域,广泛使用部门行政记录、互联网电子化数据等大数据作为常规统计调查数据的补充,提高统计调查结果的科学性。将大数据方法应用到数据质量问题查找、数据质量审核评估等工作环节, 提升统计数据质量,为遏制统计造假弄虚作假提供新技术新手段,在提升统计数据准确性可靠性方面发挥了积极作用。利用大数据开展专业统计评估,补充常规统计调查短板,完善统计调查方法,改进数据生产方式,拓展统计调查指标体系, 提升统计调查质量和效能。利用大数据改进数据处理、分析和共享机制,进一步提高开发应用数据的能力,增强统计分析、监测和预警的准确性时效性。整体而言, 目前我国政府统计运用大数据工作已经走在全球前列,和主要发达国家与地区基本站在同一起跑线上。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/587171.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

AI家居设备的未来:智能家庭的下一个大步

🔒目录 ☂️智能家居设备的发展和AI技术的作用 ❤️AI技术实现智能家居设备的自动化控制和智能化交互的依赖 AI家居设备的未来应用场景 💣智能家庭在未来的发展和应用前景 💥智能家居设备的发展和AI技术的作用 智能家居设备的发展和AI技术的…

【webrtc】MessageHandler 9: 基于线程的消息处理:执行Port销毁自己

Port::Port 构造的时候,就触发了一个异步操作,但是这个操作是要在 thread 里执行的,因此要通过post 消息 MSG_DESTROY_IF_DEAD 到thread跑:port的创建并米有要求在thread中 但是port的析构却在thread里 这是为啥呢?

【C# IO操作专题】

FileStream 是一个在多种编程语言中常见的概念,它代表了一个用于读写文件的流。在不同的编程语言中,FileStream 的实现和使用方式可能会有所不同,但基本概念是相似的:它允许程序以流的形式访问文件,即可以顺序地读取或…

二分图--判定以及最大匹配

水了个圈钱杯省一,不过估计国赛也拿不了奖,但还是小小挣扎一下。 什么是二分图:G(V,E)是一个无向图,若顶点V可以分为两个互不相交的子集A,B,并图中的每一条边(i,j)所关联的ij属于不同的顶点集,…

2024 华东杯高校数学建模邀请赛(A题)| 比赛出场顺序 | 建模秘籍文章代码思路大全

铛铛!小秘籍来咯! 小秘籍团队独辟蹊径,以图匹配,多目标规划等强大工具,构建了这一题的详细解答哦! 为大家量身打造创新解决方案。小秘籍团队,始终引领着建模问题求解的风潮。 抓紧小秘籍&#x…

24 JavaScript学习:this

this在对象方法中 在 JavaScript 中,this 的值取决于函数被调用的方式。在对象方法中,this 引用的是调用该方法的对象。 让我们看一个简单的例子: const person {firstName: John,lastName: Doe,fullName: function() {return this.firstN…

批处理优化

1.4、总结 Key的最佳实践 固定格式:[业务名]:[数据名]:[id]足够简短:不超过44字节不包含特殊字符 Value的最佳实践: 合理的拆分数据,拒绝BigKey选择合适数据结构Hash结构的entry数量不要超过1000设置合理的超时时间 2、批处理优…

cnPuTTY 0.81.0.1—PuTTY Release 0.81中文版本简单说明~~

2024-04-15 官方发布PuTTY 0.81本次发布主要修复了使用521位ECDSA密钥时的一个严重漏洞(CVE-2024-31497)。 如果您使用521位ECDSA私钥与任何早期版本的PuTTY组合,请考虑私钥已泄露的问题。强烈建议从相关文件中删除公钥,并使用新版本程序重新生成密钥对。…

6.C++模板(超全)

目录 1. 泛型编程 2. 函数模板 2.1 函数模板概念 2.1 函数模板格式 2.2 函数模板的原理 2.3 函数模板的实例化 2.4 模板参数的匹配原则 3. 类模板 1. 泛型编程 如何实现一个通用的交换函数呢? void Swap(int& left, int& right) {int temp left;…

【大模型学习】Transformer(学习笔记)

Transformer介绍 word2vec Word2Vec是一种用于将词语映射到连续向量空间的技术,它是由Google的Tomas Mikolov等人开发的。Word2Vec模型通过学习大量文本数据中的词语上下文信息,将每个词语表示为高维空间中的向量。在这个向量空间中,具有相似…

关于用户体验和设计思维

介绍 要开发有效的原型并为用户提供出色的体验,了解用户体验 (UX) 和设计思维的原则至关重要。 用户体验是用户与产品、服务或系统交互并获得相应体验的过程。 设计思维是一种解决问题的方法,侧重于创新和创造。 在启动期实现用户体验和设计思维时&#…

Chinese-CLIP使用教程

目录 一:运行环境 二:代码架构 三:数据集准备 1. 文本数据处理 训练集文本处理 测试集文本处理 2. 图像数据处理 3. 生成LMDB数据库 四、模型微调 五:模型验证与测试 1. 提取图文特征 2. 图文检索 3. 计算召回率 六…

23 JavaScript学习:验证API

JavaScript验证API 举例&#xff1a; <input id"id1" type"number" min"100" max"300" required> <button onclick"myFunction()">验证</button><p id"demo"></p><script>f…

pinctrl和gpio子系统

文章目录 一、pinctrl 子系统简介二、pinctrl子系统的配置形式分析1.主要功能2.配置格式3.pinctrl驱动匹配 三、gpio子系统1.gpio系统使用流程 四、程序举例-led五、总结 一、pinctrl 子系统简介 在led操作设备树的实验中&#xff0c;对于gpio的初始化是直接操作的寄存器&…

idea No versioned directories to update were found

idea如何配置svn以及svn安装时需要注意什么 下载地址&#xff1a;https://112-28-188-82.pd1.123pan.cn:30443/download-cdn.123pan.cn/batch-download/123-820/3ec9445a/1626635-0/3ec9445a25ba365a23fc433ce0c16f34?v5&t1714358478&s171435847804276f7d9249382ba512…

使用Mybatis映射时间 DateTime ==> LocalDateTime

首先查看&#xff0c;数据库字段&#xff1a; 书写映射实体类对象VO&#xff1a; Data public class OrderListVO implements Serializable {private Integer orderId;private String memberName;private String orderNumber;private BigDecimal orderPrice;private String l…

【数据结构与算法】力扣 239. 滑动窗口最大值

题干描述 给你一个整数数组 nums&#xff0c;有一个大小为 k **的滑动窗口从数组的最左侧移动到数组的最右侧。你只可以看到在滑动窗口内的 k 个数字。滑动窗口每次只向右移动一位。 返回 滑动窗口中的最大值 。 示例 1&#xff1a; 输入&#xff1a; nums [1,3,-1,-3,5,3…

C/C++实现高性能并行计算——1.pthreads并行编程(中)

系列文章目录 pthreads并行编程(上)pthreads并行编程(中)pthreads并行编程(下)使用OpenMP进行共享内存编程 文章目录 系列文章目录前言一、临界区1.1 pi值估计的例子1.2 找到问题竞争条件临界区 二、忙等待三、互斥量3.1 定义和初始化互斥锁3.2 销毁。3.3 获得临界区的访问权&…

安卓中对象序列化面试问题及回答

1. 什么是对象的序列化&#xff1f; 答&#xff1a; 序列化是将对象转换为字节流的过程&#xff0c;以便将其存储在文件、数据库或通过网络传输。反序列化则是将字节流重新转换为对象的过程。 2. 为什么在 Android 开发中需要对象的序列化&#xff1f; 答&#xff1a; 在 An…

ctfshow——JWT

文章目录 web 345web 346——算法改为Noneweb 347-348——爆破密匙web 349——非对称加密算法RS256私钥泄漏web 350——泄漏公钥、非对称密码算法改为对称密码算法 web 345 抓个包&#xff0c;可以看到cookie部分使用JWT&#xff08;Json Web Token&#xff09;。 JWT实际上是…