【数据分析实战】冰雪大世界携程景区评价信息情感分析采集词云

文章目录

    • 引言
    • 数据采集
      • 数据集展示
      • 数据预处理
    • 数据分析
      • 评价总体情况分析
        • 本人浅薄分析
      • 各游客人群占比分析
        • 本人浅薄分析
      • 各评分雷达图
        • 本人浅薄分析
      • 差评词云-可视化
        • 本人浅薄分析
      • 好评词云-可视化
        • 本人浅薄分析
    • 综合分析
    • 写在最后

今年冬天,哈尔滨冰雪旅游"杀疯了",在元旦假期更是被南方游客"包场"。据哈尔滨市文化广电和旅游局提供大数据测算,截至元旦假日第3天,哈尔滨市累计接待游客304.79万人次,实现旅游总收入59.14亿元。游客接待量与旅游总收入达到历史峰值。

“不是北欧去不起,而是哈尔滨更有性价比。”
“零下二十摄氏度,我在哈尔滨当‘俄式公主’。”

引言

最近几天,哈尔滨冰雪大世界也屡登社交平台热搜榜。

12月18日上午,第二十五届哈尔滨冰雪大世界开园,不到3小时,预约游玩人数已达40000人。火爆之下,游客现场大喊“退票”的视频却在网络热传。据悉,冰雪大世界有几个热门项目需要线上预约后才能玩,不少游客吐槽,这些项目不仅难约,约上后排队时间也很长,以致引发不满。舆情发酵后,次日,景区发布致歉声明并推出整改措施,哈尔滨文旅局领导赴冰雪大世界现场督导。

今天,我们通过Python采集点评网站(携程)上网友对哈尔滨冰雪大世界的评价,通过数据分析一下游客对冰雪大世界的各个不满意的点和值得学习的点。

数据采集

数据采集是数据分析的前提,在数据采集阶段,我选择了在携程网站上获取用户公开评价冰雪大世界的数据。使用了Python编程语言,结合相关库如Requests和JSON,通过网页爬虫技术实现了数据的自动抓取。共采集到5528条公开评价数据。

采集难度★★

数据集展示

_idpublishTimescorecontentpublishTypeTagipLocatedNametouristTypeDisplay
0180204656/Date(1703671819000+0800)/5太壮观啦,上一次是10年前来的,变化很大…2023-12-27 发布点评上海情侣夫妻

需要采集数据的可以联系我~
vvvvvv:176-1035-2720

数据预处理

使用了Python中一些强大的数据处理和分析工具,包括:
Pandas:用于数据清洗和整理。
Numpy:进行数学运算,如计算评分占比。
Pyecharts:生成可视化图表,直观展示分析结果。

预处理了发布日期的杂乱文字,还将一些分值拆分了出来。

_idpublishTimescorecontentpublishTypeTagipLocatedNametouristTypeDisplay景色趣味性价比
0180204656/Date(1703671819000+0800)/5太壮观啦,上一次是10年前来的,变化很大…2023-12-27上海情侣夫妻555

数据分析

通过pyecharts配合pandas、numpy进行了各个指标的分析。

评价总体情况分析

统计不同评分的占比,观察整体满意度。
在这里插入图片描述

本人浅薄分析
  1. 总体评分分布

    • 大多数用户给予景区较高的评分,特别是5分和4分,分别占总评价的69.05%和13.44%。可以看出大多数的游客对景区的整体体验是持积极态度。
  2. 主要评分集中在高分

    • 有近90%的用户给予3分及以上的评分,说明整体来说,景区受到了较为积极的评价。

各游客人群占比分析

通过用户评价中提到的信息,分析不同人群的占比。
在这里插入图片描述

本人浅薄分析
  • 主要人群占比:家庭亲子、朋友出游和情侣夫妻是该景区的主要游客群体,分别占比较大。可以看出冰雪大世界在家庭、朋友和情侣旅行市场有较好的吸引力。

  • 其他出游和商务出差占比较低:相较于其他出游和商务出差,这两类人群在评价中的占比相对较低。可以看出该景区的特色更适合休闲度假和亲子游,而在商务和其他类型旅行方面有发展空间。

各评分雷达图

在这里插入图片描述

本人浅薄分析
  • 总体评分较高:雷达图上各项评分都在4分以上,显示大多数游客对景区的各方面评价都较为满意。这是一个积极的信号,说明景区在整体上受到游客的好评。

  • 景色和景区评分相对较高:从雷达图中可以看出,景色和景区方面的评分较高,可能是景区的自然风光和整体设计得到了游客的好评。这是景区的优势,值得进一步宣传。

差评词云-可视化

差评:分值为1、2的定义为差评

在这里插入图片描述

本人浅薄分析

问题关键词预约排队滑梯摩天轮体验小时退票黄牛是差评中出现频率较高的关键词。这些词反映了一些问题,如预约流程、排队体验、设备运行时间等。景区可能需要关注这些方面,以改善游客体验。

好评词云-可视化

在这里插入图片描述

本人浅薄分析
  • 好评关键词哈尔滨滑梯很漂亮不错灯光冰雕值得是好评中出现频率较高的关键词。这些词反映了游客对景区整体美观性、设施、服务的积极评价。景区可以借助这些优势进一步宣传和推广。

综合分析

  • 冰雪大世界在吸引家庭亲子、朋友出游和情侣夫妻方面表现较好,可进一步加强在这些人群中的宣传和推广。

  • 差评中的问题关键词提示了一些流程和体验问题,景区可能需要优化一些运营方面的细节,以提升整体用户满意度。

  • 好评中的关键词反映了景区的美丽和特色,景区可以通过这些优势进行更有针对性的宣传。

  • 总体评分较高,但仍有一些方面可以改进,比如提升性价比。景区可通过进一步了解游客需求,优化服务和提升设施,以提高整体满意度和吸引更多游客。

写在最后

通过对冰雪大世界5528条携程用户公开评价的深入分析,我们深入了解了游客的评价情况,以及景区在不同方面的优势和改进空间。

该分析仅供学习交流使用,禁止用于商业用途,不构成任何投资建议。

大数据分析为运营和各行业带来了前所未有的机会,使企业能够更敏锐地洞察市场、优化运营,并更有效地应对竞争和变革。在信息时代,充分利用大数据分析,将成为企业取得竞争优势的不可忽视的关键要素。

本人数据分析领域的从业者,拥有专业背景和能力,可以为您的数据挖掘和分析需求提供支持。期待着能够与您共同探索更多有意义的数据洞见,为您的项目和业务提供数据分析方面的帮助。

创作不易,如果你觉得有帮助,请点个赞支持一下。你的鼓励是我创作的最大动力,期待未来能为大家带来更多有趣的分析文章。感谢大家的阅读和支持!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/296461.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

技术学习|CDA level I 业务分析方法

业务分析方法有三个主要构成部分:业务指标分析、业务模型分析及业务分析方法。 业务指标分析是发现业务问题的核心方法:用于通用指标和场景指标的计算及分析方法,以及指标体系的设计与应用方法。业务模型是从一系列业务行为中抽象出来的信息…

请你列出逻辑电路中的24种表达式

随着时代发展,数字电路的使用频率越来越高,完全不低于模拟电路,因此从事数字电路的工程师越来越多,如果你想成为一名优秀的数字工程师,一定要学会下面的逻辑电路表达式! 1、基本逻辑运算与运算 (AND): A AN…

04 帧 Frame

文章目录 04 帧 Frame4.1 相机相关信息4.2 特征点提取4.2.1 特征点提取 ExtractORB()4.3 ORB-SLAM2对双目/RGBD特征点的预处理4.3.1 双目视差公式4.3.2 双目图像特征点匹配 ComputeStereoMatches()4.3.3 根据深度信息构造虚拟右目图像:ComputeStereoFromRGBD() 4.4 …

Python中的h5py包使用

h5py是一个非常强大的工具,可以用于存储和处理大量科学数据。它可以帮助我们提高数据处理的效率和可靠性。 目录 一、h5py1.1 特点1.2 主要功能1.3 常用场景 二、安装h5py三、示例代码3.1 运行结果 四、总结 一、h5py h5py是Python中的一个库,提供了对H…

JS函数实现数字转中文大写

JS函数实现数字转中文大写 1. 数字转字符,分割,去除空字符2. 遍历分割字符,替换为中文3. 增加四位数单位4. 处理零5. 拼接四位数据和单位 项目中,JS将万亿以下正整数转为中文大写 1. 数字转字符,分割,去除空字符 function toChineseNumber(num){const strs num.toString().re…

计算机组成原理 总线

总线 总线定义 总线 总线是一组能为多个部件分时共享的公共信息传送线路 总线的好处 早期计算机外部设备少时大多采用分散连接方式,不易实现随时增减外部设备 为了更好地解决I/O设备和主机之间连接的灵活性问题,计算机的结构从分散连接发展为总线连接 …

Mac环境下Parallels Desktop 19的安装和使用

为了后续构建漏洞靶场和渗透测试环境,我们需要提前准备好几套与宿主机隔离的工作环境(Windows、Linux等),在Mac上最常用的就是Paralles Desktop(PD)工具了,当前最新版本为19。接下来介绍如何安装…

QT工具栏开始,退出

QT工具栏开始,退出 //初始化场景QMenuBar *bar menuBar();setMenuBar(bar);QMenu *startbar bar->addMenu("开始");QAction * quitAction startbar->addAction("退出");connect(quitAction , &QAction::triggered,[](){this->c…

Chromedriver 下载和安装指南

1. 确定Chrome浏览器版本 首先,在谷歌浏览器中找到当前版本信息。 打开“设置”,点击“关于谷歌”即可看到版本号。确保后续下载的Chromedriver版本与Chrome浏览器版本一致。或者直接跳转网页地址:chrome://settings/help 2. 下载Chromedri…

js逆向第12例:猿人学第5题js混淆-乱码增强

文章目录 那么`RM4hZBv0dDon443M=`是怎么来的?密钥怎么找加密数组怎么破解_0x4e96b4[_$pr]m=,f=时间戳是哪个?打开控制台查看数据接口 https://match.yuanrenxue.cn/api/match/5?page=2&m=1704439385499&f=1704439384000 利用postman测试接口请求,判断参数是否强…

机器学习 - 决策树

场景 之前有说过k近邻算法,k近邻算法是根据寻找最相似特征的邻居来解决分类问题。k近邻算法存在的问题是:不支持自我纠错,无法呈现数据格式,且吃性能。k近邻算法的决策过程并不可视化。对缺失数据的样本处理很不友好,…

C++ OpenGL 3D GameTutorial 1:Making the window with win32 API学习笔记

视频地址https://www.youtube.com/watch?vjHcz22MDPeE&listPLv8DnRaQOs5-MR-zbP1QUdq5FL0FWqVzg 一、入口函数 首先看入口函数main代码&#xff1a; #include<OGL3D/Game/OGame.h>int main() {OGame game;game.Run();return 0; } 这里交代个关于C语法的问题&#x…

MidJourney笔记(10)-faq-fast-help-imagine-info-public-stealth

/faq 在官方 Midjourney Discord 服务器中使用可快速生成流行提示工艺频道常见问题解答的链接。 不过这个命令,我也是没有找到入口,之前还能在MidJourney的频道里使用,然后最近发现没有权限,有点奇怪。不知道系统又做了什么升级。 /fast 切换到快速模式。

七、HTML 文本格式化

一、HTML 文本格式化 加粗文本斜体文本电脑自动输出 这是 下标 和 上标 <!DOCTYPE html> <html><head><meta charset"utf-8"><title>HTML文本格式化</title> </head><body><b>加粗文本</b><br>…

HarmonyOS应用开发学习笔记 包名、icon图标,应用名修改 UIAbility组件介绍、UIAbility启动模式、UIAbility组件基本用法

目前HarmonyOS应用主推的是Stage模型开发 一、Stage模型基本概念 项目描述UIAbility组件UIAbility组件是一种包含UI界面的应用组件&#xff0c;主要用于和用户交互。例如&#xff0c;图库类应用可以在UIAbility组件中展示图片瀑布流&#xff0c;在用户选择某个图片后&#xf…

Mysqld的关键优化参数

skip-name-resolve 现象 mysql连接很慢&#xff0c;登陆到服务器上查看服务器日志都是正常的&#xff0c;无可疑记录&#xff0c;登陆到mysql服务器上&#xff0c;查看下进程&#xff0c;发现有很多这样的连接&#xff1a; 218 | unauthenticated user | 192.168.10.6:44500 |…

Stable Diffusion架构的3D分子生成模型 GeoLDM - 测评与代码解析

之前&#xff0c;向大家介绍过3D分子生成模型 GeoLDM。 GeoLDM按照Stable Diffusion架构&#xff0c;将3D分子生成的扩散过程运行在隐空间内&#xff0c;优化了基于扩散模型的分子生成。可能是打开Drug-AIGC的关键之作。让精确控制分子生成有了希望。 详见&#xff1a;分子生成…

听GPT 讲Rust源代码--compiler(16)

File: rust/compiler/rustc_span/src/lib.rs 在Rust源代码中&#xff0c;rust/compiler/rustc_span/src/lib.rs文件定义了与Rust编译器源代码位置相关的数据结构和功能。 下面是对一些重要结构和枚举类型的详细介绍&#xff1a; SessionGlobals: 代表编译器会话&#xff08;Ses…

leetcode2975. 移除栅栏得到的正方形田地的最大面积

题目 有一个大型的 (m - 1) x (n - 1) 矩形田地&#xff0c;其两个对角分别是 (1, 1) 和 (m, n) &#xff0c;田地内部有一些水平栅栏和垂直栅栏&#xff0c;分别由数组 hFences 和 vFences 给出。 水平栅栏为坐标 (hFences[i], 1) 到 (hFences[i], n)&#xff0c;垂直栅栏为…

【大数据进阶第三阶段之Hive学习笔记】Hive查询、函数、性能优化

【大数据进阶第三阶段之Hive学习笔记】Hive安装-CSDN博客 【大数据进阶第三阶段之Hive学习笔记】Hive常用命令和属性配置-CSDN博客 【大数据进阶第三阶段之Hive学习笔记】Hive基础入门-CSDN博客 【大数据进阶第三阶段之Hive学习笔记】Hive查询、函数、性能优化-CSDN博客 ——…