【数据分析】嫡权法EWM

总结:基于熵值信息来计算出权重,数据具有客观性。

目录

简介

计算步骤

案例


简介

熵值法原理
熵值法的基本思路是根据指标变异性的大小来确定客观权重信息熵:信息量的期望。可以理解成不确定性的大小,不确定性越大,信息熵也就越大

若某个指标的信息熵越小,表明指标值得变异程度越大,提供的信息量越多,在综合评价中所能起到的作用也越大,其权重也就越大。

1、背景说明

熵值法(熵权法)是一种研究指标权重的研究方法,比如有5个指标,分别为指标1到指标5,并且有很多样本(比如100个样本),即100行*5列数据,此时研究该5个指标的权重分别是多少。

但从上述可以看到,数据格式上为100个样本即100行数据。如果说当前是面板数据即比如100家公司分别5年,那么就是100*5=500行数据,依旧还是5个指标,即500行*5列数据。此时希望利用熵值法研究该5个指标的权重情况,应该如何处理呢?

2、数据格式

首先从数据格式上,应该类似下图,即有2列数据分别标识公司ID和年份,比如当前为100家公司分别5年,那么就有100*5行的数据。

3、面板数据如何进行熵值法?

熵值法的原理是利用‘熵’来计算权重,‘熵’用来标识信息的不确定性情况,熵越大意味着不确定性越大->信息量越小->权重越小,这是熵值法的原理。

从原理角度上看:

  • 面板数据要想计算出5个指标的权重,也是利用‘熵’来计算,也即说明只要能计算出数据的‘熵’值,即可得到权重。而‘熵值’的计算上,并不会考虑是否为面板数据,因而从原理角度,面板数据与普通数据完全一致,直接放入分析即可。

从分析角度上看:

  • 针对面板数据,通常有两种做法,分别是做1次,分别重复多次再汇总,如下表格所示:

分析做法说明
一次法完全不考虑是否面板数据,直接与普通数据一样做一次分析即可
多次法比如5年数据,先筛选出第1次的数据做1次,接着重复做另外4次,分别得到5次权重,然后将权重求平均值。

 一次法,此种做法非常常见,即完全不考虑是否为面板数据,在原理上并没有任何问题。因为熵值法计算权重的原理是利用‘熵’值信息,相当于把100家公司5年即500个数字当成一个序列,计算该序列的‘熵’用于判断该500个数字的不确定性情况。最终得到权重。

另外也可分别筛选出某年数据后,基于100家公司即100个数字看成1个序列,计算该100个数字的不确定性情况,并且最终得到权重,此法称作多次法。

计算步骤

(1) 数据标准化。由于一般会使用到多个评估指标,而这些指标的量纲和单位多数情况下都不相同,因此需要对这些指标数据进行归一化处理,以消除因量纲不同而对评价结果造成的影响,从而确保评价结果的客观性与公正性。单条标准化数据正向和负向指标公式分别如下所示:

对于正向指标希望值越大越好,负向指标希望越小越好,需保证标准化后都是正数

(2) 求各指标在各方案下的比值。计算第j项指标的第i个样本所占的比重,并将其看作信息熵计算中用到的概率,如下公式所示:

(3)求各指标的信息熵。 计算第 j 项指标的熵值ej ,如下公式所示:

(4) 计算各指标客观权重值wj ,如下公式所示:

案例

评价该年级的11个班级的整体情况,如下所示,11个班级有9个指标因素

第一步,进行数据标准化

数据标准化后的结果为:

第二步,求各指标在各方案下的比值

使用公式:

第三步,求各指标的信息熵

使用的公式:

第四步,确定各指标的权重

使用公式:

第五步,计算综合得分

使用公式:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/543091.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

js脚本解决因挂VPN导致boss上高德地图无法正常规划公交路线问题

​ 情况说明: 最开始一直以为boss上的查询自己所在地点到面试地点的公交的功能有bug,总是规划路线失败,结果这个一调试,发现是自己的经纬度有问题导致的。 程序猿嘛,开机VPN必须是挂着的,这就导致了boss获取到了错误…

Python中合并列表的五种方法!

在 Python 编程中,我们经常需要将两个或多个列表合并为一个。这个过程通常是为了数据处理或者进行更复杂的操作。 列表合并是一个将两个或多个列表的元素整合到一起的过程。Python 提供了多种方式来实现这一点,每种方式都有自己的应用场景。 一、使用 …

SpringBoot编写一个SpringTask定时任务的方法

1,在启动类上添加注解 EnableScheduling//开启定时任务调度 2, 任务(方法)上也要添加注解: Scheduled(cron " 0 * * * * ? ") //每分钟执行一次 域: 秒 分 时 日 月 周 (年&#…

内网渗透-windows权限维持的方法

windows权限维持的方法 文章目录 windows权限维持的方法一、影子账户二、粘滞键后门三、logon scripts后门五、注册表自启动后门六、屏幕保护程序后门七、计划任务后门八、服务自启动后门九、黄金票据十、白银票据十二、bitsadmin十五、CLR劫持 一、影子账户 1.使用如下命令创…

微信小程序开发遇到的奇奇怪怪的问题

新建项目发现顶部栏标题不生效问题 开发者工具新建项目默认开启全局Skyline渲染引擎,因为Skyline不支持原生导航栏,所以就没显示原生导航栏了。 如果想用回原生导航栏,可以把app.json里面的 "renderer": "skyline", 去掉…

2D AI交互数字人:赋能文旅、金融、政务、教育行业数字化转型

AI交互数字人结合了语音合成、语音识别、语义理解、图像处理、机器翻译、虚拟形象驱动等多项AI核心技术,可以提供服务导览、业务咨询、语音互动交流、信息播报等智能服务。 其中,2D AI交互数字人是采集真人视频,通过AI训练,生成逼…

竞赛 基于CNN实现谣言检测 - python 深度学习 机器学习

文章目录 1 前言1.1 背景 2 数据集3 实现过程4 CNN网络实现5 模型训练部分6 模型评估7 预测结果8 最后 1 前言 🔥 优质竞赛项目系列,今天要分享的是 基于CNN实现谣言检测 该项目较为新颖,适合作为竞赛课题方向,学长非常推荐&am…

ELFK日志分析系统之搭建ELF+Filebeaat+Zookeeper+Kafka

引言 结合前面所学 http://ELK日志分析系统 一、为什么要做日志分析平台 随着业务量的增长,每天业务服务器将会产生上亿条的日志,单个日志文件达几个GB,这时我们发现用Linux自带工具,cat grep awk 分析越来越力不从心了&#…

从0到1实现RPC | 11 丰富测试案例

测试案例主要针对服务消费者consumer,复杂逻辑都在consumer端。 常规int类型,返回User对象 参数类型转换,主要实现逻辑都在TypeUtils工具类中。 测试方法重载,同名方法,参数不同 方法签名的实现,主要逻辑…

RHCE--dns正反向解析小实验

一、准备工作 1.关闭防火墙 [rootserver ~]# setenforce 0 [rootserver ~]# systemctl stop firewalld 2.安装软件 [rootserver ~]# yum install bind -y 二、正向解析 服务端IP客户端IP网址192.168.203.128192.168.203.130www.openlab.com 服务端配置静态ip [root…

蓝桥杯嵌入式第十五届省赛真题题目

蓝桥杯昨天也考完了,大家可以看看题目 客观题题目 程序题题目

遥感卫星:探索地球的科技之旅

遥感卫星是人类探索地球、理解地球、保护地球的重要工具,其发展历程承载了人类对地球的探索与认知的历程。从最初的概念到如今的高科技应用,遥感卫星技术的发展见证了人类科技的不断进步与创新。 初心萌芽: 遥感卫星的发展始于20世纪中叶&…

AGV小车导航避障雷达SE-0533(CNS-LS05C)激光传感器RS232|RS485|CAN BUS连线说明

AGV小车导航避障雷达SE-0533(CNS-LS05C)激光传感器广泛应用到AGV小车,RGV小车,无人叉车、搬运机器人等领域。本文重点介绍AGV小车导航避障雷达SE-0533(CNS-LS05C)激光传感器RS232|RS485|CAN BUS连线说明。 一、线序定义 1、传感器线缆线序定义 SE-053…

【网络编程】高性能并发服务器源码剖析

hello !大家好呀! 欢迎大家来到我的网络编程系列之洪水网络攻击,在这篇文章中,你将会学习到在网络编程中如何搭建一个高性能的并发服务器,并且我会给出源码进行剖析,以及手绘UML图来帮助大家来理解&#xf…

【Vue】面试题

vue的组建通信方式 父子关系:props & $emit 、 $parent / $children 、 ref / $refs 、 插槽跨层级关系: provide & inject通用方案:Vuex 或 eventbus 插播:兄弟组建怎么通信? eventbusVuex通过中间件&…

【游戏开发之热更新技术】

游戏开发之热更新技术 热更新技术是指在不重新发布和安装应用的情况下,对已部署的应用程序进行更新和修补的技术。这种技术在现代软件开发中变得越来越重要,因为它能够为用户提供更加及时的服务和更好的体验。以下是一篇关于热更新技术的文章&#xff0…

HttpServletRequest/Response

HttpServletRequest 一些常用类的用法 package Demo;import javax.jws.WebService; import javax.servlet.ServletException; import javax.servlet.annotation.WebServlet; import javax.servlet.http.HttpServlet; import javax.servlet.http.HttpServletRequest; import ja…

【前端】es-drager 图片同比缩放 缩放比 只修改宽 只修改高

【前端】es-drager 图片同比缩放 缩放比 ES Drager 拖拽组件 (vangleer.github.io) 核心代码 //初始宽 let width ref(108)//初始高 let height ref(72)//以下两个变量 用来区分是单独的修改宽 还是高 或者是同比 //缩放开始时的宽 let oldWidth 0 //缩放开始时的高 let o…

蓝桥杯-可获得最小值

前缀和思想: #include<bits/stdc.h>using namespace std;long long n,k;const int N200010;long long a[N],sum[N];int main() {cin>>n>>k;for(int i1;i<n;i)cin>>a[i];sort(a1,a1n);for(int i1;i<n;i){sum[i]sum[i-1]a[i];}long long ans1e18;…

【第十四届蓝桥杯省赛题目】

选择题&#xff1a; 1.设只含根结点的二叉树高度为1&#xff0c;共有62个结点的完全二叉树的高度为&#xff1f; A.4 B.5 C.6 D.7 解析&#xff1a;高度为K的满二叉树 节点数为 2k-1 &#xff0c;如果K6 最多有63个节点 故答案为6 选C 2.C中&#xff0c;bool类型的变量占用字…