文本挖掘 day4 基于PMC知识框架文本挖掘的新能源汽车政策动态评价

基于PMC知识框架文本挖掘的新能源汽车政策动态评价

  • 2. 研究设计
    • 2.1 研究技术路线
    • 2.2 数据采集
    • 2.3 动态分相
  • 3. 基于PMC知识框架的策略动态挖掘
    • 3.1 PMC知识框架的建立
    • 3.2 基于PMC知识框架的策略挖掘字典
      • 3.2.1 字典建立步骤
      • 3.2.2 建立经验证据的词典
    • 3.3 策略动态挖掘分析
      • 3.3.1 发行主题(issuing subjects)的动态挖掘
      • 3.3.2 政策措施(policy measure)的动态挖掘
  • 4. 基于策略挖掘的动态评估
    • 4.1 基于PMC知识框架的多输入-输出表
    • 4.2 基于策略挖掘的PMC指标计算
  • 5. 结论和政策含义
    • 5.1 结论

2. 研究设计

2.1 研究技术路线

image-20230713161852977

本研究路线如图1所示,分为以下几个步骤:

首先,在梳理PMC指标相关文献的基础上,结合新能源汽车产业发展的应用场景,建立了定量分析新能源汽车政策的PMC知识框架

然后,基于上述PMC知识框架建立策略挖掘字典。新能源汽车政策文献从官方网站、专业数据库和资源网站收集,参考新能源汽车政策研究的相关文献进行补充;对策略文本语料库进行清理,去除空值和停止词,建立新能源汽车策略挖掘字典,提高分词准确性;基于PMC知识框架提取关键词,并结合专家知识进行补充和分类,完成PMC知识框架各维度的策略挖掘字典。

其次,基于策略字典对策略文档进行动态挖掘,对PMC知识框架各维度中策略文本的外部属性和内部属性进行动态挖掘分析。

最后,基于PMC知识框架挖掘对策略进行动态评价。采用文本匹配技术,将策略文本与PMC知识框架各维度的字典进行匹配,通过机器赋值计算出各策略的PMC指标得分,并将各阶段PMC指标的平均值可视化,实现基于PMC指标知识挖掘的动态评价。

2.2 数据采集

考虑到地方政策主要是中央政策的具体回应和延续,本文主要选取中央部委发布的国家政策文件作为政策数据样本。首先从国务院、工信部等官方网站收集,以“新能源汽车”为标题关键词进行搜索;然后,我们通过专业数据库如中国知网的政府文献数据库和资源网站如北京大学的法宝进行了进一步的搜索。最后,我们补充了现有文献中提出的政策,以确保政策样本的全面性。选定的政策从2001年1月1日至2021年12月31日发布,最终筛选确定了265个政策。

2.3 动态分相

新能源汽车政策的挖掘与评价需要在产业发展阶段的背景下进行动态分析。根据现有文献研究(Zhang and Fang, 2022;庞等,2022),新能源汽车产业的发展阶段可分为以下几个阶段:

(1) 启动阶段(2001—2008)

(2) 试点示范阶段(2009—2013年)

(3) 推广阶段(2014—2016年)

(4) 过渡阶段(2017—2019年)

(5) 高质量发展阶段(2020—至今)

第五阶段,我国新能源汽车进入高质量发展阶段。逐步取消购货补贴,进一步修订完善相关政策。此外,产业“十四五”规划提出,到2025年,将形成包括技术创新和产业生态在内的多维度新能源汽车产业体系。发展新能源汽车规模,重点支持产业发展,提高技术创新和产品质量。

3. 基于PMC知识框架的策略动态挖掘

3.1 PMC知识框架的建立

基于相关研究文献和新能源汽车政策应用场景中的实际问题,建立了新能源汽车政策的PMC知识框架。

政策的外部属性包括:政策的性质(P1)、签发主体(P2)、有效性水平(P3)和政策的时限(P4)。

政策的内部属性包括:政策目标(P5)、政策功能(P6)、政策措施(P7)、政策工具(P8)和政策受体(P9)。

如**表1(部分)**所示,一共有9个主要维度变量和42个子维度变量。

image-20230718094935608

3.2 基于PMC知识框架的策略挖掘字典

3.2.1 字典建立步骤

基于PMC知识框架建立策略挖掘字典的主要步骤如下:

(1)将收集到的策略样本语料库导入python中进行数据清理,包括去除空值、去除不激活词等。

(2)将文本挖掘机器识别与本体语义相结合,创建新能源汽车策略词典。

首先,对新能源汽车产业政策相关文献进行梳理,将学者分析新能源汽车产业政策内容的关键词进行归纳,形成初步的政策词汇。然后利用文本挖掘技术识别关键字,通过高频词挖掘等方法提取并输出策略语料库中的高频词,从而更新初步的策略词汇。最后,基于专家知识对政策内容进行理解和分析,厘清政策内容维度,并对各内部维度的关键词进行改进。

(3)基于上述过程,迭代优化新能源汽车政策词汇。最后,根据PMC知识框架对字典中的关键词进行分类,并对各个次级变量的关键词进行专家知识补充,最终建立基于PMC知识框架的更完整的新能源汽车策略字典(如表2所示)。

image-20230718101007410

3.2.2 建立经验证据的词典

首先,对现有文献中关于新能源汽车政策挖掘的关键词进行整理,包括热点话题关键词,如基础设施建设中的“基础设施”、“建设”。利用供给侧政策工具的“研发补贴”、“经营补贴”和“财政支持”三种类型的政策工具的关键词建立政策字典。

然后,将收集到的新能源汽车政策语料库导入python文本挖掘中,并将TF-IDF (Wang and Stewart, 2015;采用KIM D et al., 2019)算法提取分词后的高频关键词,并进行人工筛选和过滤,剔除“新能源”、“汽车”等通用词。剔除对政策特征分析无明显影响的词,并整理出政策各维度中需要分析的有效高频词。

最后,专家根据PMC知识框架对关键词进行分类。专家对各子维的关键词进行补充,如“充电成本”、“利息补贴”等,最终完成基于PMC知识框架的新能源汽车政策挖掘字典。如表2所示的dic - tionary摘录。由于篇幅限制,附录A是完整的字典。

3.3 策略动态挖掘分析

3.3.1 发行主题(issuing subjects)的动态挖掘

政策发布主体的维度反映了政策的外部属性,挖掘分析主要采用Ucinet、Gephi等社会网络分析方法和软件对政策发布主体的政府间合作网络指标进行分析。各演化阶段政策发布主体共现网络的可视化分析如图2所示。

image-20230718103039807

通过计算网络平均度、网络图密度等指标,量化新能源汽车政策发布主体各阶段共现网络,网络指标统计如表3所示。

image-20230718103051076

由图2和表3可以看出发行主体多元化的趋势。网络的平均度数和密度呈逐渐增加的趋势。新能源汽车政策发放主体数量的增长表明,发放主体之间的联系日益紧密。模块化指数呈现出由下降到上升的趋势,说明发行主体之间的合作范围呈现先扩大后缩小的趋势。平均聚类系数呈波动上升趋势,平均路径长度指标整体呈下降趋势,说明新能源汽车发行主体间合作不断深化。在现阶段的发展中,以财政部、工信部、科技部、发改委为核心节点的网络基本形成,四部委之间的合作比较密切,但四部委与其他部门之间的合作网络相对松散。

3.3.2 政策措施(policy measure)的动态挖掘

基于PMC知识框架的策略挖掘字典,对策略度量维度的样本策略语料库进行动态挖掘。将样本政策语料库按新能源汽车产业发展阶段进行时间切片,分阶段进行政策措施的LDA主题建模,包括单词、主题和文档三层结构(Tazibt and Aoughlis, 2019)。首先,根据主题一致性算法确定LDA主题的最优数量;然后,对建模的主题进行专家过滤,以删除那些不重要和与研究相关性较小的主题。最后,基于PMC知识框架的子维度对主题进行命名。各阶段的LDA挖掘结果如表4所示。由于篇幅限制,完整的开采结果见附录B。

4. 基于策略挖掘的动态评估

首先,基于PMC政策分析知识框架(表1),建立多投入产出表,对政策进行多维量化。然后,基于PMC知识框架的字典(表2),对PMC指标进行机器赋值,完成客观定量评分。最后,通过PMC曲面和凹指数图对政策动态评价结果进行可视化分析。

4.1 基于PMC知识框架的多输入-输出表

image-20230718104353918

为了更好地量化政策各维度的价值,基于新能源汽车产业政策PMC知识框架(表2),构建多投入产出表(表5),其中9个主维度变量权重相等,共42个子维度变量,通过这一定量分析框架,从多个维度对政策进行了评价。每个个体变量都可以通过存储大量的数据来度量,从而实现从不同维度对政策的评价,反映一定的政策维度的演变。

4.2 基于策略挖掘的PMC指标计算

5. 结论和政策含义

5.1 结论

考虑新能源汽车产业政策面临的复杂应用场景,从政策的外部属性和内部属性多维度出发,建立了基于PMC知识边缘框架的政策挖掘知识字典,采用文本挖掘技术,通过机器赋值完成265个新能源汽车政策PMC评价分数的计算。通过动态挖掘和评价分析,多维度探索新能源汽车产业政策中存在的问题,并提出相应的优化对策。具体研究结论如下:

结论1:由于各阶段政策的逐步分化和发展,政策内部一致性水平不够,呈现下降趋势。PMC指标评分结果(表5)和分数泡图(图4)显示出完美评分时pol - ies不足,PMC有阶段性下降的趋势。反映了新能源汽车政策从粗略的总体布局到亚维度政策的细化和完善的逐步发展,新能源汽车政策的出台力度逐步增强,但目前实现全面深化发展仍有差距。因此,子维度政策需要进一步完善,增加优级政策数量,深化新能源汽车产业高质量发展。

结论2:政策平衡差距明显,政策内外属性之间的良性协同效应较弱,政策各维度之间的组合效应较低。通过对PMC曲面的凹度分析(图5),可以发现PMC曲面的最高点和最低点之间存在明显的空隙。其中,谷点政策维度包括政策发布机构和政策有效性水平,峰值点政策维度包括政策工具和政策措施。因此,需要平衡政策的外部属性和内部属性,完善和优化政策设计,加强政策发布部门和政策措施的协调,提高政策的有效性,促进政策更有效的实施。

**结论3:**政策凹度加剧,政策创新程度与政策可持续性之间存在一定的不平衡。通过计算各阶段政策的PMC凹度指数(图6)可以发现,凹度显著恶化的主要维度主要是目前的政策函数、政策目标和政策措施。因此,政策功能维度侧重于市场链和产业链,而创新链存在结构性缺陷;政策目标层面侧重于社会目标,但缺乏经济目标和生态目标;政策工具供给层面不足,对企业的资源支持相对不足。要强化创新链、经济目标、生态目标和供给维度的隐性政策,不断完善政策规则和标准,推动新能源汽车产业高质量发展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/39637.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

力扣 452. 用最少数量的箭引爆气球

题目来源:https://leetcode.cn/problems/minimum-number-of-arrows-to-burst-balloons/description/ C题解1: 根据x_end排序,x_start小的在前,这样可以保证如果第 i 个球的x_end大于等于第 j 个球的x_start时,第 j 个球…

JavaWeb——基于Spring Boot的图书数字化管理系统的设计与实现

课程设计总结 1 概述 1.1 项目开发背景 随着信息技术的快速发展,数字化管理已经成为各行各业提高效率和管理水平的重要手段。在图书管理领域,数字化管理系统可以有效地提高管理效率,提供更好的用户体验。本项目旨在开发一个基于Spring…

【Elasticsearch】DSL查询文档

目录 1.DSL查询文档 1.1.DSL查询分类 1.2.全文检索查询 1.2.1.使用场景 1.2.2.基本语法 1.2.3.示例 1.2.4.总结 1.3.精准查询 1.3.1.term查询 1.3.2.range查询 1.3.3.总结 1.4.地理坐标查询 1.4.1.矩形范围查询 1.4.2.附近查询 1.5.复合查询 1.5.1.相关性算分 …

LabVIEW开发惯性测量系统

LabVIEW开发惯性测量系统 惯性导航系统是通过将惯性传感器直接绑定在载体主体上来完成制导和导航任务的系统。所以惯性测量系统主要是动态静态地测试陀螺仪和加速度计的性能。测试点和计算点数众多,对测试速度和精度要求高。基于上述特点,基于虚拟仪器软…

Docker安装ElasticSearch/ES

目录 前言准备拉取ElasticSearch镜像安装ElasticSearch拉取elasticsearch-head镜像安装elasticsearch-head参考 前言 TencentOS Server 3.1Docker version 19.03.14, build 5eb3275d40 准备 docker 已安装。 安装 docker 参考:【Centos 8】【Centos 7】安装 docke…

gitbash2.41安装教程——2023.07

文章目录 1、下载安装包2、安装 1、下载安装包 进入官网下载,官网链接 上面有多种系统可以选择,我是windows,点击windows进行下载 这里可以直接下载最新版本的git 2.41.0 64位。 下载可能有点慢,耐心等待。 2、安装 下载完…

三种视频字幕提取工具让你更好地阅读和学习

视频字幕提取技术是指通过计算机算法自动从视频中提取出字幕文本的技术。这项技术能够大大提高视频的可用性,使得聋哑人士、语言学习者以及听力不佳的观众可以更好地理解视频内容。那么你知道视频字幕提取工具免费有哪些吗?接下来我将分享三款我亲测好用…

Oracle 的视图

Oracle 的视图 源数据: -- Create table create table STU_INFO (id NUMBER not null,name VARCHAR2(8),score NUMBER(4,1),class VARCHAR2(2) ) tablespace STUDENTpctfree 10initrans 1maxtrans 255storage(initial 64Knext 1Mminextents 1maxextents unlim…

单片机尽力少用位域操作

1、在51单片机中少用uint32_t类型,查看汇编真的好多条指令,尽力避免少用。 2、在32位单片机中,u8、u16、u32类型操作起来基本没有什么影响,下图是我做的测试,可能测试不全面,按照当前测试,在32…

使用Postman+JMeter进行简单的接口测试

以前每次学习接口测试都是百度,查看相关人员的实战经验,没有结合自己公司项目接口真正具体情况。 这里简单分享一下公司项目Web平台的一个查询接口,我会使用2种工具Postman和JMeter如何对同一个接口做调试。 准备工作 首先,登录公…

再开源一款轻量内存池

前两天已开源线程池,开源一款轻量线程池项目,本节继续开源另一个孪生兄弟:内存池。 本节的线程池与内存池代码解析会在我的星球详细讲解。 内存池:https://github.com/Light-City/light-memory-pool 线程池:https://gi…

【数据结构】图解八大排序(下)

文章目录 一、前言二、快速排序1. hoare 版2. 挖坑法3. 前后指针法4. 快排的非递归实现5. 时空复杂度分析 三、归并排序1. 递归实现2. 非递归实现 四、计数排序 一、前言 在上一篇文章中,我们已经学习了五种排序算法,还没看过的小伙伴可以去看一下&…

python将dataframe数据导入MongoDB非关系型数据库

文章目录 pymongo连接新建数据库和集合pandas导入数据插入数据数据查看 pymongo连接 import pymongo client pymongo.MongoClient("mongodb://localhost:27017/") dblist client.list_database_names() for db in dblist:print(db) #查看已有数据库admin bilibil…

接口测试 react+unittest+flask 接口自动化测试平台

目录 1 前言 2 框架 2-1 框架简介 2-2 框架介绍 2-3 框架结构 3 平台 3-1 平台组件图 1 新建用例 2 生成测试任务 3 执行并查看测试报告 3-2 用例管理 3-2-1 用例设计 3-3 任务管理 3-3-1 创建任务 3-3-2 执行任务 3-3-3 测试报告 3-3-4 邮件通知 1 前言 构建…

科技资讯|Apple Vision Pro新专利,关于相对惯性测量系统的校正

美国专利商标局正式授予苹果一项 Apple Vision Pro 相关专利,该专利涵盖了具有视觉校正功能的相对惯性测量系统。这样的系统用于弥补头显内的眼前庭不匹配,当 VR 头显中发生的事情与现实世界环境中发生的运动不匹配时,可能会导致恶心。 苹果…

怎么用Midjourney制作表情包

要使用Midjourney制作表情包,可以按照以下步骤进行操作: 1. 打开Midjourney的官方网站或下载Midjourney应用程序,并登录你的账户。 2. 在Midjourney中,选择创建新项目或表情包。 3. 在项目中,你可以选择使用预设的模…

笔记本电脑的电池健康:确保长时间使用和优异性能的关键

笔记本电脑已经成为我们日常生活中不可或缺的工具,无论是办公、学习还是娱乐,我们都依赖着它的便携性和高效性能。而在所有的硬件组件中,电池健康被认为是确保长时间使用和良好性能的关键因素之一。一块健康的电池不仅能提供持久的续航时间&a…

list模拟实现

一、结点的定义 有三个成员&#xff0c;2个指向前面和后面的指针&#xff0c;一个表示结点存储T类型的值。 对于_prev和_next&#xff0c;类型是 list_node<T>*&#xff0c;不是list_node*&#xff0c;加上类型参数T之后&#xff0c;才是模板类的类型。 构造函数中&am…

大模型时代,腾讯云“复制”腾讯|WAIC2023

点击关注 文&#xff5c;郝鑫 编&#xff5c;刘雨琦 刚过去的WAIC&#xff08;世界人工智能大会&#xff09;俨然成为了大模型厂商的成果汇报大会。 百度文心大模型升级到3.5版本&#xff0c;训练速度提升2倍&#xff0c;推理速度提升30倍&#xff1b;华为云发布盘古大模型3…

【数学建模】统计分析方法

文章目录 1.回归分析2. 逻辑回归3. 聚类分析4. 判别分析5. 主成分分析6. 因子分析7. 对应分析 1.回归分析 数据量要多&#xff0c;样本总量n越大越好——>保证拟合效果更好&#xff0c;预测效果越好 一般n>40/45较好 方法 建立回归模型 yiβ0β1i……βkxkiεi 所估计的…