数学建模-基于机器学习的家政行业整体素质提升因素分析

基于机器学习的家政行业整体素质提升因素分析

整体求解过程概述(摘要)

  家政服务业即为家庭提供多种类服务的专门行业,在第三产业中占有重要地位。但近年来,由于人工智能家居产业的发展与客户对家政从业者的要求水平不断提高,家政行业仍面对较大问题。
  本文从家政从业人员的角度出发,首先,通过网络爬虫爬取家政从业者相关数据,并对数据进行量化处理后展开分析。其次,对家政从业者的工作经历和培训评价进行词频分析和词云图制作,以此来预判客户需求的倾向性。接着进行因子分析,得到家政从业者的综合评分公式,以此对家政从业者进行综合评估。而后,为进一步研究家政从业者的专业水平与核心素养对其制定预期工资的影响,在因子分析的基础上,使用回归模型进行验证,发现模型拟合度较好,说明家政从业者专业水平与其工资联系密切。在模型构建方面,我们建立了 BP 神经网络,并采用 Levenberg-Marquardt 算法仿真,得出准确率为 90.0%的模型;同时,在使用模型筛选器将机器模型筛选出最适用的袋装树模型后,
  通过对训练集进行训练、优化剪枝最终得到较为简洁且采样误差与交叉验证误差分别为 0.1334 和 0.1735 的决策树模型,以此判断家政从业者的个人特质是否能使其个人工资超过行业平均工资。最后通过代入训练和袋外数据测试构建出准确性约为 90.5%的随机森林模型,分析影响家政从业者预期工资的因素。通过模型正确率分析得出,随机森林模型预测准确性较高。
  通过分析得出结论,一方面,家政从业者想使得预期工资达到平均工资水平,须提升个人专业水平,参与正规专业培训,丰富个人专业技能,提升市场竞争力;另一方面,由于家政行业规模扩大,行业要求更加严格,行业秩序更加规范,家政行业整体素质有较大提升。

问题分析

  对于家政服务从业人员的研究,本文进行了线上搜集数据,内容涉及基本信息、就业情况、培训状况、求职意向、工作经历、客户评价六大方面;对于家政服务需求人员进行线上调研,内容涉及家政服务人员满意度评价、问题及建议两方面内容;对于家政服务中介机构进行线上调研,内容涉及基本信息、雇佣状况、服务需求、培训方法、对策前景等五个方面。本次研究具体内容涵盖工作 id、实名信息、求职意向、是否住家、期望工资、年龄、学历、生肖、婚姻、籍贯、身高、体重、经验、状态、做饭口味、会说语言、工作范围、特殊技能、拥有证书、培训记录、工作记录,老师评价等。

模型的建立与求解

  本文选用 Python 软件以网络爬虫方式来进行数据收集,以家政港作为平台爬取文本信息,了解家政从业人员基本信息、个人状况、客户评价等。在数据收集后,运用 Excel 进行数据量化处理,随后运用 Python 软件进行词频分析和词云图程序编写;运用 Stata 进行因子分析与回归分析;运用 Matlab2018b 软件对 BP 神经网络模型的数据进行归一化处理与仿真模拟;运用 DevC++与 Matlab共同编程实现有关随机森林模型的模型分类筛选、决策树和随机森林主函数的编写以及随机森林程序的运行;运用 Mathtype 进行相关数学公式的编写;运用Photoshop、Tableau、Visio2013 分别进行词云图图片处理、地图和因子分析树状图以及流程图神经网络图的绘制,以此来进行统计推断的估计、统计分组确定、综合指标的测算、统计模型的衡量等。

模型的建立与求解整体论文缩略图

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

全部论文请见下方“ 只会建模 QQ名片” 点击QQ名片即可

(代码和文档not free)

x=[5119.276,6688.352,6842.004,7196.007,8360.984,8255.013,12839.98,14399.89,14502.29,16537.52];

lag=1;
% 自回归阶数
iinput=x;
% x为原始序列(行向量)
n=length(iinput);
%准备输入和输出数据
inputs=zeros(lag,n-lag);
for i=1:n-lag
inputs(:,i)=iinput(i:i+lag-1);
end
targets=x(lag+1:end);
%创建网络
hiddenLayerSize = 10;
%隐藏层神经元个数
net = fitnet(hiddenLayerSize);
% 避免过拟合,划分训练,测试和验证数据的比例
net.divideParam.trainRatio = 50/100;
net.divideParam.valRatio = 25/100;
net.divideParam.testRatio = 25/100;
%训练网络
[net,tr] = train(net,inputs,targets);
net.trainParam.show=1000; %每1000轮回显示一次结果
net.trainParam.Lr=0.05; %学习速率为0.05
net.trainParam.epochs=3000; %循环10000次
net.trainParam.goal=0.0000000001; %均方误差
%% 根据图表判断拟合好坏
%yn=net(inputs);
% errors=targets-yn;
%figure, ploterrcorr(errors)
%绘制误差的自相关情况(20lags)
% figure, parcorr(errors)
%绘制偏相关情况
% [h,pValue,stat,cValue]= lbqtest(errors)
%Ljung-Box Q检验(20lags) figure,plotresponse(con2seq(targets),con2seq(yn))
%看预测的趋势与原趋势% figure, ploterrhist(errors)
%误差直方图% figure, plotperform(tr)
%误差下降线%% 下面预测往后预测几个时间段
fn=3;
%预测步数为fn。

f_in=iinput(n-lag+1:end);f_out=zeros(1,fn);
%预测输出% 多步预测时,用下面的循环将网络输出重新输入
for i=1:fn f_out(i)=net(f_in);
f_in=[f_in(2:end);f_out(i)];
end
% 画出预测图
figure,plot(2007:2016,iinput,’b’,2016:2019,[iinput(end),f_out],’r’)
全部论文请见下方“ 只会建模 QQ名片” 点击QQ名片即可

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/221784.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Token 和 N-Gram、Bag-of-Words 模型释义

ChatGPT(GPT-3.5)和其他大型语言模型(Pi、Claude、Bard 等)凭何火爆全球?这些语言模型的运作原理是什么?为什么它们在所训练的任务上表现如此出色? 虽然没有人可以给出完整的答案,但…

基于Java SSM框架实现社区疫情防控管理系统项目【项目源码+论文说明】计算机毕业设计

基于java的SSM框架实现社区疫情防控管理系统演示 摘要 随着科学技术的飞速发展,社会的方方面面、各行各业都在努力与现代的先进技术接轨,通过科技手段来提高自身的优势,社区疫情防控管理信息系统当然也不能排除在外。社区疫情防控管理信息系…

记录:Unity脚本的编写9.0

目录 射线一些准备工作编写代码 突然发现好像没有写过关于射线的内容,我就说怎么总感觉好像少了什么东西(心虚 那就在这里写一下关于射线的内容吧,将在这里实现射线检测鼠标点击的功能 射线 射线是一种在Unity中检测碰撞器或触发器的方法&am…

vivado如何进行增量编译

情况1 如果是根据 placement 或者 routing 进行增量编译,直接右键点击要跑的 implement,,选择set incremental implement , 然后选第二项,指定 要参考的 routing.dcp 或者 placement.dcp 的路径即可 情况2 如果只参考 synthesis …

网络层之IPv6

学习的最大理由是想摆脱平庸,早一天就多一份人生的精彩;迟一天就多一天平庸的困扰。各位小伙伴,如果您: 想系统/深入学习某技术知识点… 一个人摸索学习很难坚持,想组团高效学习… 想写博客但无从下手,急需…

2023年【危险化学品经营单位主要负责人】及危险化学品经营单位主要负责人模拟考试

题库来源:安全生产模拟考试一点通公众号小程序 危险化学品经营单位主要负责人根据新危险化学品经营单位主要负责人考试大纲要求,安全生产模拟考试一点通将危险化学品经营单位主要负责人模拟考试试题进行汇编,组成一套危险化学品经营单位主要…

linux无法打开M4a格式音频的解决方法

linux是开源系统,之所以打不开,是因为部分linux系统为了避免版权问题,没有m4a的解码插件。所以,解决的办法是安装如下两个非常小的转换器,我们一般用不到转换器的功能,而是反向应用,通过两个几十…

jenkins搭建文档

jenkins搭建文档 简介一、安装运行环境1、安装JDK环境1)查询自带的JDK2)卸载自带的JDK3)创建java文件夹并将jdk上传到该文件夹4)解压5)配置环境变量6)配置生效7)验证是否成功 2、安装maven环境1…

第四代可燃气体监测仪监测场景有哪些?

随着城市化进程的加速,燃气作为一种重要的能源在每个城市都得到了广泛的应用。然而燃气泄漏所引发的安全问题也日益增加,为了保障燃气安全并防止泄漏事故的发生,可燃气体监测仪在其中发挥着重要的作用。可燃气体监测仪适用于甲烷气体浓度监测…

解决(error) ERR Errors trying to SHUTDOWN. Check logs.问题~

该问题出现在我在使用shutdown关闭redis服务器时,出现该问题的原因是由于配置文件的日志文件位置未配置或者缺少日志文件 我自己出现该问题是因为缺少日志文件,解决步骤如下所示: 第一步:在该目录下使用touch命令创建日志文件 第…

免费分享一套Springboot+Vue前后端分离的学生网上请假系统,挺漂亮的

大家好,我是java1234_小锋老师,看到一个不错的SpringbootVue前后端分离的学生网上请假系统,分享下哈。 项目视频演示 【免费】springbootvue学生网上请假系统毕业设计 Java毕业设计_哔哩哔哩_bilibili【免费】springbootvue学生网上请假系统…

Java_ArrayList顺序表详解

目录 前言 顺序表 ​编辑 顺序表和数组 ArrayList简介 说明 ArrayList使用​编辑 ArrayList常见操作 ArrayList实现二维数组 ArrayList的遍历 ArrayList的扩容机制 总结 前言 一个高端的程序员,往往都是数据结构学的很好,判断一个程序的优劣也是看数据结构学的好与坏.…

【iApp源码】最新多功能无需服务器软件库源码

源码介绍: 多功能无需服务器的软件库源码,只需在理想后台添加一个后台应用和一个文档即可 安装教程: 1.用浏览器打开理想后台地址 http://apps.xiaofei.run/user/ 2.没有账号的话就注册一个,免费使用 3.登录上去,然后…

硬件开发笔记(十四):RK3568底板电路LVDS模块、MIPI模块电路分析、LVDS硬件接口、MIPI硬件接口详解

若该文为原创文章,转载请注明原文出处 本文章博客地址:https://hpzwl.blog.csdn.net/article/details/134634186 红胖子网络科技博文大全:开发技术集合(包含Qt实用技术、树莓派、三维、OpenCV、OpenGL、ffmpeg、OSG、单片机、软硬…

球机实现飞机追踪

目录 1. 背景2. 实现步骤2.1 飞机识别2.2 计算目标与球机中心的偏离角度2.2.1 获取球机视场角2.2.2 计算偏离角度 2.3 计算角速度2.4 将角速度映射到球机转速挡位 1. 背景 球机本身带有一些跟踪算法,比如:人员跟踪、车辆跟踪,比较有限。如果…

函数递归。

文章目录 前言一、什么是递归二、递归的限制条件三、递归举例1.求n的阶乘2. 举例2:顺序打印一个整数的每一位 四、递归的优劣总结 前言 不多废话了,直接开始。 一、什么是递归 递归是学习C语言函数绕不开的⼀个话题,那什么是递归呢&#xf…

linux添加_管理_查看磁盘

6.2.1 添加磁盘 关闭虚拟机 》》编辑虚拟机设置》》硬盘》》5G 6.2.2 管理磁盘流程 分区》》格式化/文件系统》》挂载 隔间 分格子 加入口/目录 6.2.3 查看磁盘信息 ll /dev/sd* ​ brw-rw---- 1 root disk 8, 0 Oct 17 2023 /dev/sda brw-rw---- 1 roo…

TA-Lib学习研究笔记(九)——Pattern Recognition (4)

TA-Lib学习研究笔记(九)——Pattern Recognition (4) 最全面的形态识别的函数的应用,通过使用A股实际的数据,验证形态识别函数,用K线显示出现标志的形态走势,由于入口参数基本上是o…

Linux库之动态库静态库

一、什么是库(Library) 二、库的分类 三、静态库、动态库优缺点 四、静态库的制作和使用 五、动态库的制作和使用 SO-NAME–解决主版本号之间的兼容问题 基于符号的版本机制 共享库系统路径 共享库的查找过程 有用的环境变量 gcc 编译器常用选项 Linux共…

小航助学题库白名单竞赛考级蓝桥杯等考scratch(12级)(含题库教师学生账号)

需要在线模拟训练的题库账号请点击 小航助学编程在线模拟试卷系统(含题库答题软件账号) 需要在线模拟训练的题库账号请点击 小航助学编程在线模拟试卷系统(含题库答题软件账号)