【数字基础设施1007】探索数字基础设施的影响:宽带政策变量数据集来了!

今天给大家分享的是国内顶级期刊2023年发表论文《数字基础设施与代际收入向上流动性——基于“宽带中国”战略的准自然实验》使用到的重要数据集——“宽带中国”政策变量数据、互联网发展指数以及工具变量(所在城市到杭州市的球面距离和到“八纵八横”政策节点城市距离)数据,该文章研究了数字基础设施对农村人口代际收入向上流动的影响,在新古典增长模型和代际收入流动分析框架基础上,从理论上探讨了数字基础设施对代际收入向上流动的影响以及作用机制,然后将“宽带中国”政策外生冲击与CFPS数据相结合,利用DID模型以及包括工具变量法在内的多种内生性分析方法从实证角度检验了这一影响,并探讨了其中的作用机制。该论文在研究过程中使用到了宽带中国政策变量数据、数字基础设施代理变量互联网发展指数数据以及内生性检验中的工具变量数据(所在城市到杭州市的球面距离和到“八纵八横”政策节点城市距离),我们对这些数据进行了整理,并进行了适当的拓展方便大家研究,,数据获取请关注公众号“明天科技屋”,打开公众号文章获取文末数字关键词并回复,在该数据发布24小时之内可以通过分享获得。

一、论文讲解  

 该文章将宽带中国政策与CFPS数据相结合,采用双重差分模型研究数字基础设施对代际收入向上流动的影响,并进行了更换被解释变量和核心解释变量、遗漏变量分析、平行趋势检验、稳定单元处理效果假设检验以及工具变量法等一系列稳健性检验,结果仍然保持文件,并且从提高父代对子代的人力资本投资回报、减少子代对父代社会资本继承、增加子代的“市场运气”等方面进行了机制分析,最终得出结论,给出相应的政策建议。

(一)基准模型

y_{ict}=\beta _{1}D_{c(i)}\cdot T_{t}+{w}'_{ict}\beta +\delta _{i}+\tau _{t}+\varepsilon _{ict} 

其中,y_{ict}为被解释变量,定义为c市农村户籍的i子代在t时是否实现了代际收入的向上流动,如果父代收入位于同代收入分布的后50%,而子代收入位于同代收入的前50%,则认为子代实现了代际收入的向上流动,取值为1,否则为0。D_{c(i)}\cdot T_{t}是文章关注的DID项,即个体i所在城市在t时刻是否开始实施政策的处理变量。w_{ict}是个体、父母、家庭和省市层面的控制变量。\delta _{i}\tau _{t}分别是个体以及时间固定效应。\varepsilon _{ict}是随机扰动想。

(二)数据介绍 

宏观数据主要包括数字基础设施发展状况、省市层面的控制变量、机制变量等。其中数字基础设施发展状况代理变量的“宽带中国”政策数据来源于工信部。省市层面的控制变量以及机制变量数据来源于CEIC数据库、复旦大学和第一财经研究院等发布的数据。微观数据来源于中国家庭追踪调查(CFPS)。

(三)实证分析 

        1. 基准回归

        2.更换被解释变量结和核心解释变量 

论文中在这一块研究中对被解释变量和核心解释变量均进行了更换,被解释变量更换请查看论文,核心解释变量采用了互联网发展指数来代理数字基础设施发展状况,互联网发展指数由移动电话用户数、互联网宽带接入用户数、信息传输、计算机服务和软件业的就业人员、电信收入以及普惠金融指数等指标通过主成分分析得到,我们对这部分数据进行了收集整理,具体数据详情和合成步骤请查看后文。

        3.遗漏变量分析

        4.平行趋势检验 

        5.稳定单元处理效果假设检验

        6.工具变量法 

 该论文研究过程中主要使用了两个工具变量(所在城市到杭州市的球面距离和到“八纵八横”政策节点城市距离),我们根据论文中的参考文献,找到了这两部分数据的原始信息,并进行这部分数据的收集整理,数据详情请阅读后文

(四)作用机制

        1.数字基础设施有助于提高父代对子代对人力资本投资回报 

        2.数字基础设施减少了子代对父代社会资本继承

        3.数字基础设施增加了子代的“市场运气” 

(五)结论与政策含义 

以上就是本篇论文的大致框架结构和内容,接下来给大家介绍重点内容我们收集整理的数据。

二、重要数据 

该论文因为是和CFPS微观个体层面数据相结合,论文只提到了“宽带中国”政策相关的执行年份,研究样本大致上也是政策实施年份左右,即2013-2016年左右,政策变量的使用也是以地级市城市与个体进行匹配,我们收集整理了“宽带中国”政策实施的地级市数据,并考虑到大家会进行省级或地级市的其他层面研究,将数据区间进行了拓展,得到了2008年-2022年“宽带中国”政策地级市实施数据,同时论文中使用到了我们上述提到的两个工具变量数据,我们也进行了整理,同时论文研究过程中使用到了互联网发展指数的指标,我们也进行了收集整理,结合实际数据情况得到了2011-2021年地级市城市的互联网发展指标数据,方便大家研究。

(一)宽带中国政策原始数据 

“宽带中国”政策名单是从2014年开始发布的,一共三个批次名单,时间区间为2014年-2016年,包含地级市、城市群、自治州以及县级市多种类型名单,其中长株潭城市群包括长沙市、株洲市以及湘潭市三个城市,名单中我们进行了拆分,我们收集整理名单数据,数据保留在“原始数据”表中,具体展示如下:

(二)宽带中国面板数据 

在原始名单基础上,我们将数据转换成了面板数据,其中,重庆市的试点都是辖区进行试点,我们考虑在地级市层面的研究应该将重庆市纳入处理组更为合理,同时我们将数据进行了延伸拓展,数据区间为2008-2022年,没有生成2023年的数据是因为大家在实际研究过程中2023年的其他数据经常会缺失,同时也不会延伸到最近年份进行研究,我们的数据是可以满足大家的实际研究需求的,大家不要盲目追求数据数量,寻找适合自己研究的数据最好,这一点我们会在将互联网发展指数的时候谈到这点,最终得到了2008年-2022年300个地级市层面面板数据,政策实施的虚拟变量保留在DID中,数据保存在“宽带中国面板数据”表中,数据展示如下:

(三)工具变量数据 

论文在进行内生性检验的时候使用到了工具变量数据,我们找到了论文中提到到的参考文献,并根据原参考文献中使用的工具变量进行分析,即所在地到杭州市的球面距离(张勋等(2019))和 所在地到“八纵八横”光缆骨干网络节点城市的球面距离(田鸽和张勋(2022)),其中在《干线光缆传输网与中国信息网络城市节点体系》中讲到北京和南京是“八纵八横”光缆骨干网络节点城市,因此我们取所在地到北京和南京球面距离最小距离为该工具变量距离(论文作者回答),同时我们保存了到北京和南京的球面距离数据以及最终的最小距离数据,方便大家检查,最终得到了2008-2022年300个地级市数字基础设施工具变量面板数据,保存在“工具变量数据”表中,数据展示如下:

(四) 互联网指数原始数据

论文中使用到了互联网发展指数指标,该指标由移动电话用户数、互联网宽带接入用户数、在信息传输、计算机服务和软件业的就业人数、电信业务收入以及普惠金融指数等指标通过主成分分析得到,我们收集整理了这些数据,最终得到了2011-2021年互联网发展指数原始数据指标,数据中存在少量缺失值,我们对这些缺失值数据按照统计年鉴等数据源进行了核对,均为正常缺失,官方也没有公布,为什么我们的数据是从2011年开始的呢?是因为普惠金融指标是从2011年开始更新的,所以数据也只能从2011年开始,在这里我特地强调一下,目前市面上存在一些使用普惠金融指标进行合成的数据,最终的数据区间是从2000年开始的,这是非常严重的错误,他们常用的办法是将2011年之前的指标全部设置为0,不谈他们最终合成方法是否正确,连最基本的数据质量都无法保证,而且价格非常贵,动不动就70、80甚至上百,非常气愤,希望大家注意一下数据质量,不要被骗。原始数据保存在“互联网原始数据”表中,数据展示如下:

 (五)互联网发展指数

在原始数据的基础上,我们按照要求采用主成分分析对数据进行合成,首先我们对缺失值数据进行了处理,对数据严重缺失的城市以及涉及撤销的城市,我们进行了剔除,剔除数据都是合理的,大家可以使用原始数据进行对照,剩余数据采用stata中线性插值的方法填充缺失值数据,填充结果均以“填充数据-”开头保存在相应的列中,我们对填充数据进行了核查,与数据原始趋势大致一致,说明填充没有什么问题,填充完成之后我们开始使用主成分分析进行指标合成,合成方法参考国内顶级期刊数量经济技术经济研究中《中国金融稳定指数构建、形势分析与预判》中采用的指标合成方法,使用stata完成指标合成,参考论文的主成分选择标准,根据PCA分析结果,我们确定选择为3个主成分。

同时,我们参考论文进行了KMO和Bartlett's 球形检验,检验结果说明,数据总体上适合进行主成分分析,检验结果如下:

最终我们开始进行指标合成,合成的结果存在负值,按照我们实际分析需求以及参考论文中的处理办法,将指标进行了归一化处理,映射到0-1区间上的正值数据,最终合成指标保存在“总互联网发展指数”列中,全部数据保存在“互联网发展指数”表中,如果大家选择我们的数据,还会将主成分分析的代码一起发送给大家,数据展示如下: 

以上就是本次分享的全部内容,大家可以看到我们对分享的数据是十分认真和用心的,并且站在使用者的角度考虑,所以大家完全可以相信数据的质量,最后,数据在发布时间起24小时内通过关键词指示操作即可免费获取,关注公众号“明天科技屋”并回复数字关键词了解数据获取方式,该数据由明天科技屋一手整理,版权归明天科技屋所有,未经允许,不得用于商业盈利,否则将追随法律责任!!!    

文章关键词为:“1007”    

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/754232.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

2.最简单的hello驱动

写驱动最快的方法就是抄内核中的其他驱动&#xff0c;这里选择的是/Linux-4.9.88/drivers/char/mem.c 第一步新建一个hello_drv.c,把mem.c中的头文件都复制过来 #include <linux/mm.h> #include <linux/miscdevice.h> #include <linux/slab.h> #include <…

干货︱部分领域数字孪生白皮书及报告汇总(附下载)

在国家政策和市场需求的双轮驱动下&#xff0c;数字孪生技术越来越为人们所熟知。作为数字化的重要底层技术&#xff0c;数字孪生在优化各行各业产业布局、实现产业结构优化、打通生产上下游链条、迈向产业智能发展、推动行业高质量发展中发挥着重要作用。为了帮助广大读者朋友…

uni-app通过配置package.json实现环境变量、自定义条件编译

文章目录 前言官方提示使用方法微信小程序配置如下自定义条件编译使用方法 前言 uni-app 官方概括 官方文档 在开发web时&#xff0c;有时需要一套代码编译发布到不同的站点&#xff0c;比如主站和微信h5站。&#xff08;注意不是一套代码内部自适应不同浏览器&#xff0c;是真…

贾英才主任的中医探索之路

在北京崇文门中医医院&#xff0c;贾英才主任在中医领域的钻研从未停歇。他对药理的探究和药物搭配的研究&#xff0c;展现出了非凡的专注与执着。 贾英才主任常常埋首于浩瀚的中医典籍之中&#xff0c;逐字逐句地研读古代名医的论述&#xff0c;试图从那些古老的智慧中汲取精…

第十九课,编写并调用自定义函数

一&#xff0c;函数五大组成部分 因为其重要性故再此强调&#xff0c;参数列表可以为任意个数&#xff0c;返回值只能有一个&#xff08;请初学者暂时这样认为&#xff09; 特殊的&#xff0c;如果不需要返回结果&#xff0c;用None替代&#xff01; 二&#xff0c;编写自定义…

BUUCTF--WEB

首頁 - OWASP Top 10:2021 [极客大挑战 2019]EasySQL 类型:sql注入 使用万能密码 flag{f580db5b-c0c9-4b13-bfb6-adfa525c93f5} [极客大挑战 2019]Havefun 类型:代码审计 F12打开浏览器控制台 GET请求,在url添加参数/?cat=dog访问 返回flag{f60c7d5c-9f44-4e92-88c0…

操作系统期末复习(对抽象概念的简单形象化)

操作系统 引论 定义与基本概念&#xff1a;操作系统是计算机硬件与用户之间的桥梁&#xff0c;类似于家中的管家&#xff0c;它管理硬件资源&#xff08;如CPU、内存、硬盘&#xff09;&#xff0c;并为用户提供方便的服务&#xff08;应用程序执行、文件管理等&#xff09;。…

三星DRAM、NAND,“又双叒叕”带头涨价了

据韩国媒体《每日经济新闻》报道&#xff0c;三星电子计划在第三季度上调服务器DRAM和企业级NAND闪存的价格&#xff0c;涨幅预计在15%-20%&#xff0c;主要受人工智能(AI)需求激增的推动。这一举措有望提振公司下半年业绩。 据《经济日报》报道援引业内消息&#xff0c;由于厂…

数据资产赋能企业决策:通过精准的数据分析和洞察,构建高效的数据资产解决方案,为企业提供决策支持,助力企业实现精准营销、风险管理、产品创新等目标,提升企业竞争力

一、引言 在信息化和数字化飞速发展的今天&#xff0c;数据已成为企业最宝贵的资产之一。数据资产不仅包含了企业的基本信息&#xff0c;还蕴含了丰富的市场趋势、消费者行为和潜在商机。如何通过精准的数据分析和洞察&#xff0c;构建高效的数据资产解决方案&#xff0c;为企…

使用QGIS进行研究区域制图实战

目录 前言 一、QGIS的版本和数据介绍 1、关于QGIS版本 2、需要准备的数据 二、准备制图 1、制作全国区位图 2、矢量和遥感信息的编辑 三、出图编辑 1、设置主题信息 2、打印布局制作 3、美化地图 总结 前言 俗话说“一图胜千言”&#xff0c;在地理信息的领域中&…

利用代理IP实现高效大数据抓取的策略与技巧

在当今信息爆炸的时代&#xff0c;数据对于各行各业都至关重要。而数据的获取往往需要通过网络爬取。然而随着网络安全意识的提高和反爬虫机制的加强&#xff0c;传统的数据爬取方式可能会受到限制。在这种情况下&#xff0c;代理IP技术的应用就显得尤为重要。本文将探讨代理IP…

Java编程基本功大揭秘 | 详解深入分析Java线程池源码和底层原理,掌握实战技巧【1】

详解深入分析Java线程池源码和底层原理 文章大纲引言Java线程池概念及重要性 ThreadPoolExecutor类的概述ThreadPoolExecutor类的基本功能和作用**基本功能****核心作用** ThreadPoolExecutor主要构造函数及其参数继承关系链功能介绍ThreadPoolExecutor 构造器构造器参数构造器…

SysML与MBSE的关系

SysML与MBSE的关系 对于任何基于模型的系统工程 &#xff08;MBSE&#xff09; 方法&#xff0c;推荐的最佳实践是基于模型的语言、基于模型的工具、基于模型的流程和基于模型的架构框架的协同应用&#xff0c;如下图所示 系统架构四元组 图。经过十年将SysML应用于棘手的系统…

MATLAB算法实战应用案例精讲-【数模应用】线性判别分析(附MATLAB、python和R语言代码实现)

目录 前言 算法原理 什么是判别分析 线性判别分析(LDA) 数学模型 二分类 多分类LDA ​编辑 算法思想: 费歇(FISHER)判别思想 贝叶斯(BAYES)判别思想 LDA算法流程 LDA与PCA对比 SPSSPRO 1、作用 2、输入输出描述 3、案例示例 4、案例数据 5、案例操作 …

MySQL高级-SQL优化- update 优化(尽量根据主键/索引字段进行数据更新,避免行锁升级为表锁)

文章目录 0、update 优化1、创建表2、默认是行锁3、行锁升级为表锁4、给name字段建立索引 0、update 优化 InnoDB的行锁是针对索引加的锁&#xff0c;不是针对记录加的锁&#xff0c;并且该索引不能失效&#xff0c;否则会从行锁升级为表锁。 1、创建表 create table course(…

【Python机器学习实战】 | 基于支持向量机(Support Vector Machine, SVM)进行分类和回归任务分析

&#x1f3a9; 欢迎来到技术探索的奇幻世界&#x1f468;‍&#x1f4bb; &#x1f4dc; 个人主页&#xff1a;一伦明悦-CSDN博客 ✍&#x1f3fb; 作者简介&#xff1a; C软件开发、Python机器学习爱好者 &#x1f5e3;️ 互动与支持&#xff1a;&#x1f4ac;评论 &…

物联网 IoT 收录

物联网IoT日常知识收录 thingsboard, nodered是国际大品牌&#xff0c; iotgateway是国内的&#xff0c; 几个scada, pyscada, json-scada都还不错&#xff0c;比较一下。thingsboard-gateway是python系的&#xff0c;如果你愿意&#xff0c;可以用这个作为公司的物联网网关。…

圈子系统搭建教程,以及圈子系统的功能特点,圈子系统,允许二开,免费源码,APP小程序H5

圈子是一款社区与群组的交友工具。你可以在软件内创造一个兴趣的群组从而达到按圈子来交友的效果用户可以根据自己的兴趣爱好。 1. 创建圈子 轻松创建专属圈子&#xff0c;支持付费型社群。 2. 加入圈子 加入不同圈子&#xff0c;设置不同名片&#xff0c;保护隐私。 3. 定…

【笔记】echarts图表的缩放和鼠标滚动冲突的处理解决方案

解决方案不是很好&#xff0c;来源于github的issue&#xff0c;官方提供了&#xff0c;组合键触发缩放的功能。 https://github.com/apache/echarts/issues/5769 https://echarts.apache.org/zh/option.html#dataZoom-inside.zoomOnMouseWheel dataZoom-inside.zoomOnMouseWhe…

java基于ssm+jsp 多人命题系统

1管理员功能模块 管理员登录&#xff0c;管理员通过输入用户、密码等信息进行系统登录&#xff0c;如图1所示。 图1管理员登录界面图 管理员对个人中心进行操作填写原密码、新密码、确认密码并进行添加、删除、修改以及查看&#xff0c;如图2所示。 图2个人信息功能界面图 学…