基于smardaten无代码开发舆情分析系统

一、前言

在日常生活中,有各种各样的资讯、社交平台。这些平台充斥着大量信息,这些信息中隐含了许多有用数据,但是这些数据无法之间获取,且难以展示,于是就有了舆情分析系统。

舆情分析系统是一个综合的系统,专注于这些数据的某些方面进行分析、显示。比如挖掘当今流行的话题、话题的舆论、公众情感等。舆情分析有助于对社交资讯等平台的信息进行管理挖掘,并展示给用户。

本文要做的就是实现一个舆情分析系统,本文会专注舆情分析系统的某几个部分。舆情分析系统的实现是多样的,为了方便本文使用无代码平台smardaten,使用smardaten可以减少大量开发工作,快速开发。

二、系统概览

2.1 舆情分析系统

舆情分析系统是一个综合性很强的系统,里面涉及爬虫、情感分析、主题词提取、数据可视化等技术。舆情分析系统整体可以分成三个部分,分别是数据采集、数据分析、数据展示。整体如下,其中上层是用户直接接触的:

首先需要数据,数据的来源是多样的。可以使用爬虫爬取,也可以使用开放平台的数据或者内部数据。把数据整理成固定的格式,便于后续处理。

舆情分析系统的数据可以是微博热搜、抖音热榜、百度热榜等。这些榜单话题对应的评论也是非常重要的信息。

得到数据后,需要对数据进行分析处理。比如分析等关键字,或者话题情感分析,又或者群众的心理变化等。

分析完数据后,就需要展示数据了。相比之下数据的展示是最直观的,也是客户直接接触的。很多时候数据大屏会有一种科技感,让客户感觉非常高端。客户高兴,才能保证前两部分有效。

数据展示的方式是多样的,情感的分布可以用饼图展示,情感变化趋势可以用折线图展示,当前话题可以用词云展示。除了这些还有许多其它展示方式,在后续实现时详细介绍。

2.2 smardaten平台介绍

smardaten是一个无代码平台,可以让用户专注于程序的逻辑,而不用编写复杂的代码,快速开发应用程序。smardaten使用可视化的方式构建程序,平台中内置了许多组件,包括布局、模板、图表、多级菜单等,使用时直接拖拽即可。

使用smardaten可以快速开发许多复杂应用,比如GIS分析、知识图谱、数据大屏等。以“电力行业-分布式光伏服务平台”为例,页面需要多级菜单、图表、分页等功能,使用smardaten可以很快速实现这些功能,下图是一个示例。

smardaten还支持各种主流数据源,包括MySQL、Oracle、Access等常用数据库,还有图数据库Neo4j等,另外还支持Rest-api等,以下是一个示例:

除了直接从数据库获取数据外,也可以采集数据经过ETL统一处理得到我们想要的数据形式。更方便处理。

另外,系统中还需要一些逻辑控制。在smardaten中,逻辑也可以用可视化的方式实现,比如点击按钮后需要做出各种响应,这些响应可以用列表的形式展示出来,方便用户设置:

不同的动作对应不同的子操作,因此可视化的方式也能实现非常复杂的逻辑,开发复杂程序也没有问题。正是因为开发方便,因此选用smardaten平台开发。

另外smardaten中内置了商超,可以下载模板应用,具体见:http://appstore.sdata1010.cn/

三、系统搭建

smardaten可以直接直线使用,也可以离线部署,具体参考:https://s3.smardaten.com/ ,我们直接直线使用,构建应用。在实现系统时,我们可以把系统分成三个部分,分别是:数据接入、舆情分析、数据展示。下面分别实现各个部分。

3.1 数据接入

在开始创建应用前,需要准备好数据。数据的来源可以是开放平台的api,也可以是自己的数据库。本应用使用数据库存储数据,smardaten支持MySQL、Oracle、MongoDB、SQLServer各种主流数据库,具体使用大致相同,本应用使用MySQL作为数据源。

首先进入主页面:https://s3.smardaten.com/home,鼠标移至左上角、选择数据源、选择MySQL、填写连接信息。具体步骤如下:

在填写数据库连接信息时,主要填写三个部分,具体如下图:

分别为:

  1. 数据库连接串,形如:jdbc:mysql://ip:port/mydb,比如jdbc:mysql://127.0.0.1:3306/text
  2. 数据库用户名
  3. 数据库用户密码

填写完成后,可以点击测试连接测试连通性。之后点击保存即可。保存后,此时数据还未真正接入,我们还需要采集数据,设置采集规则才行。设置完采集规则后,点击开始采集,此时输入才真正接入资产,我们可以在资产列表看到采集结果:

在本次案例中,数据库主要有两张表,表的字段和表的关系如下:

现在数据接入完成,下面就可以对数据进行处理了。

3.2 数据预处理

来自多个数据源的数据通常是不统一的,因此需要对数据进行处理。这里的处理包括数据清洗、数据整合等。两者都可以使用数据流来实现,数据流的创建如下:

一些简单处理工作可以用格式化来处理:

整合两张表的数据,则可以处理字段,然后把数据建表输出,此时运行后可以得到新的表:

创建新表后,可以在数据图书馆中查看新表对应的资产:

后续可以直接使用这些数据用于展示。

3.3 舆情分析

舆情分析可以有很多层面的分析,首先最基础的就是文本情感分析。在本次应用中我们假设已经完成这部分操作,在此基础上做宏观的分析。下面列举几个本应用要实现的分析:

  1. 数量统计:分析积极、消极评论的比例,并可视化
  2. 变换趋势统计:分析各个时间段情感变换情况
  3. 统计各个主题下去情感分别情况

除此之外也可以添加一些其它分析,具体实现与上面是类似的。上述几种分析也可以使用数据流来分析。

在创建数据流后,可以对数进行各种操作,包括字段选择、聚合、排序等。首先我们完成上述第一个统计,即计数,我们要统计评论表sentiment字段的具体情况,此时数据流可以如下图:

在输入数据源中选定comment表,并在统计中选定sentiment字段即可。最后输出的输入就是统计结果。

第二个则是需要分组统计,为了方便我们可以把时间转换成年月形式,再对时间进行计数,这样可以达到同样的效果,具体数据流如下:

其中时间格式化操作可以把时间转换成特定格式,如果想观察情感按月的变换情况,则把时间格式转换成年月,如果想观察情感按天的变换情况,则把时间格式转换成年月日即可,具体操作如下:

如果想要应用更丰富,也可以作为交互,让用户选择以何种方式统计。

然后是最后一个,第三个分析需要进行连表操作,连表操作可以用连接实现,此时数据流如下:

对topic、comment两个表进行连接,然后再统计comment的sentiment字段。这样我们就完成了分析操作了,通过拖拽修改数据流,我们可以完成许多非常复杂的分析。接下来就是把数据展示出来了。

3.4 创建应用

在展示之前,还需要创建应用,依次:创建应用、WEB+移动端、输入应用名称、完成创建,具体操作见下图:

在创建应用后会进入开发应用的界面,界面主要分为四个部分,各个部分负责不同的功能,左侧负责页面的管理,可以创建、绑定页面;右侧为具体的设置信息,可以完成组件的修改、数据绑定等;顶部负责添加组件、设置布局等操作;中间则是效果预览。具体如下:

创建好应用后就可以完成后续的工作了。

3.5 实现

下面我们设计一下应用的整体框架,应用分为三个页面,分别为热点话题、情感分析、情感监测。

其中热点话题用来展示话题数据,情感分析则用来展示评论的情感分布,而情感检测则是展示情感按时间变换的趋势。知道这点后就可以在应用中添加对应页面了,在页面左上角部分可以添加导航和页面:

热点话题主要是展示话题信息,可以根据不同作者不同列进行展示,这里我们用三列布局嵌套表格来实现:

标题部分可以和作者字段进行绑定,这里我使用固定值。下面就是把各列与具体数据绑定了,点击某一列,选择高级开发,此时列表会有一个按钮,我们可以在按钮配置中去掉该按钮。下面要做的就是把组件添加上去,并绑定数据,左边选择要显示的字段,右边将字段与资产绑定起来,这样数据变换时页面也会发生变换:

另外两个也执行同样的操作即可。如果想要更丰富,可以对不同列执行不同的筛选。下面是显示效果:

我们还可以在此基础上进行一些美化工作。下面就是完成情感分析部分了,情感分析可以饼图来实现。不过只显示情感分布有些单调,可以显示一些其它数据,这里就展示部分积极和部分消极评论,整体布局如下:

其中上方和左侧的显示操作与前面没有区别,这里不再赘述。下面我们来上述饼图的数据绑定。

饼图数据可以是静态数据,也可以绑定资产,这里选择3.2中第一个数据流对应的资产,绑定成功后就可以显示积极消极评论的情感分布情况:

第二个饼图可以绑定类似的资产,这里我没有额外去创建。

最后就是显示情感监测了,具体操作与饼图非常类似。我们在图表中选择折线图:

然后和饼图一样绑定资产,这里绑定3.2中第二个数据流对应的资产。为了丰富页面,我们可以把第三个资产的数据也显示在当前页面。我们可以使用页签来显示,选择不同话题的页签就展示不同的数据,首先把页签添加到页面,并设置页签的条件:

这样我们就完成了应用的搭建。不过还有许多细节值得去修改的。

这里介绍了部分分析的具体操作,我们可以对系统做更丰富的分析,下面是最终的效果:

3.6 其它

在实际应用中,可以展示内容可以更加丰富。smardaten中也提供了更多丰富的展示组件,比如可以使用更丰富的图表展示,在smardaten中还有雷达图、3D图等。

或者可以分地区展示。在smardaten中提供了地理位置相关的组件,如果可以获取话题、城市信息,则可以结合展示:

四、系统总结

系统整体有三个部分,分别是数据、分析、展示。数据的来源是多样的,因此需要进行特征数据,在smardaten中可以用数据流实现,根据不同的要求创建不同的数据流。而分析在本系统中只做了情感分析,这里可以使用开放平台的api实现,或者可以自己额外编写程序。最后则是展示,不同的数据使用不同方式展示,最直观的展示就是使用图表。展示的组件需要与数据绑定在一起。更多内容可以参考:https://s3.smardaten.com/ ,读者可以自行体验。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/34709.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

基于minsit数据集的图像分类任务|CNN简单应用项目

Github地址 Image-classification-task-based-on-minsit-datasethttps://github.com/Yufccode/CollegeWorks/tree/main/ImageProcessing/Image-classification-task-based-on-minsit-dataset README 摘要 本次实验报告用两种方式完成了基于minst数据集完成了图像的分类任务…

被吐槽 GitHub仓 库太大,直接 600M 瘦身到 6M,这下舒服了

前言 忙里偷闲学习了点技术写了点demo代码,打算提交到我那 2000Star 的Github仓库上,居然发现有5个Issues,最近的一条日期已经是2022/8/1了,以前我还真没留意过这些,我这人懒得很,本地代码提交成功基本就不…

Python dict keys方法:获取字典中键的序列【将keys转为list】

描述 dict.keys()方法是Python的字典方法,它将字典中的所有键组成一个可迭代序列并返回。 使用示例 >>> list({Chinasoft:China, Microsoft:USA}.keys()) [Chinasoft, Microsoft] >>> test_dict {Chinasoft:China, Microsoft:USA, Sony:Japan,…

【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(7 月 4 日论文合集)

文章目录 一、检测相关(15篇)1.1 Artifacts Mapping: Multi-Modal Semantic Mapping for Object Detection and 3D Localization1.2 Shi-NeSS: Detecting Good and Stable Keypoints with a Neural Stability Score1.3 HODINet: High-Order Discrepant Interaction Network for…

机器学习一:线性回归

1 知识预警 1.1 线性代数 ( A T ) T A (A^\mathrm{T})^\mathrm{T}A (AT)TA$ ( A B ) T A T B T (AB)^\mathrm{T}A^\mathrm{T}B^\mathrm{T} (AB)TATBT ( λ A ) T λ A T (\lambda A)^\mathrm{T}\lambda A^\mathrm{T} (λA)TλAT ( A B ) T B T A T (AB)^\mathrm{T}B^…

【算法与数据结构】28、LeetCode实现strStr函数

文章目录 一、题目二、暴力穷解法三、KMP算法四、Sunday算法五、完整代码 所有的LeetCode题解索引,可以看这篇文章——【算法和数据结构】LeetCode题解。 一、题目 二、暴力穷解法 思路分析:首先判断字符串是否合法,然后利用for循环&#xff…

2023年全国节能宣传“节能低碳,你我同行”主题有奖竞答

2023年的7月10日至16日是第33个全国节能宣传周,主题是“节能降碳,你我同行”。 为践行低碳生活,切实做到节能降碳,各大企事业单位纷纷举办“节能低碳,你我同行”主题2023年全国节能宣传有奖竞答。 有奖知识竞答活动方…

Prometheus实现自定义指标监控

1、Prometheus实现自定义指标监控 前面我们已经通过 PrometheusGrafana 实现了监控,可以在 Grafana 上看到对应的 SpringBoot 应用信息了, 通过这些信息我们可以对 SpringBoot 应用有更全面的监控。 但是如果我们需要对一些业务指标做监控,…

【AI实战】从零开始搭建中文 LLaMA-33B 语言模型 Chinese-LLaMA-Alpaca-33B

【AI实战】从零开始搭建中文 LLaMA-33B 语言模型 Chinese-LLaMA-Alpaca-33B 简介环境配置环境搭建依赖安装 代码及模型权重拉取拉取 Chinese-LLaMA-Alpaca拉取 llama-30b-hf 模型权重及代码拉取 chinese-llama-lora-33b 模型权重及代码 合并模型权重先转换 pth 类型的模型权重&…

只出现一次的数字

题目链接 只出现一次的数字 题目描述 注意点 1 < nums.length < 30000-30000 < nums[i] < 30000除了某个元素只出现一次以外&#xff0c;其余每个元素均出现两次 解答思路 最初想到使用一种数据结构将元素存储起来&#xff0c;但是空间复杂度为O(n)&#xff0…

【花雕】全国青少年机器人技术一级考试备考实操搭建手册6

随着科技的不断进步&#xff0c;机器人技术已经成为了一个重要的领域。在这个领域中&#xff0c;机械结构是机器人设计中至关重要的一部分&#xff0c;它决定了机器人的形态、运动方式和工作效率。对于青少年机器人爱好者来说&#xff0c;了解机械结构的基础知识&#xff0c;掌…

大语言模型的百家齐放

基础语言模型 概念 基础语言模型是指只在大规模文本语料中进行了预训练的模型&#xff0c;未经过指令和下游任务微调、以及人类反馈等任何对齐优化。 如何理解 只包含纯粹的语言表示能力,没有指导性或特定目标。 只在大量无标注文本上进行无监督预训练,用于学习语言表示。 …

git 新建分支,切换分支,上传到远程分支

git 在使用的过程中&#xff0c;有的时候我们需要更换一个分支才存贮数据&#xff0c;作为版本的一个迭代或者是阶段性成果的一个里程碑。 如何来做操作呢&#xff1f; 在git中&#xff0c;可利用checkout命令转换分支&#xff0c;该命令的作用就是切换分支或恢复工作树文件&a…

【微信小程序开发】第 9 课 - 小程序的协同工作和发布

欢迎来到博主 Apeiron 的博客&#xff0c;祝您旅程愉快 &#xff01; 时止则止&#xff0c;时行则行。动静不失其时&#xff0c;其道光明。 目录 1、协同工作 1.1、了解权限管理需求 1.2、了解项目成员的组织结构 1.3、小程序的开发流程 2、小程序成员管理 2.1、成员管…

Nftables栈溢出漏洞(CVE-2022-1015)复现

背景介绍 Nftables Nftables 是一个基于内核的包过滤框架&#xff0c;用于 Linux 操作系统中的网络安全和防火墙功能。nftables 的设计目标是提供一种更简单、更灵活和更高效的方式来管理网络数据包的流量。 钩子点&#xff08;Hook Point&#xff09; 钩子点的作用是拦截数…

DMDSC共享存储集群启动、关闭及介绍

DMDSC介绍 DM 共享存储数据库集群&#xff08;DMDSC&#xff09;。DM共享存储数据库集群&#xff0c;允许多个数据库实例同时访问、操作同一数据库&#xff0c;具有高可用、高性能、负载均衡等特性。DMDSC 支持故障自动切换和故障自动重加入&#xff0c;某一个数据库实例故障后…

使用GeoPandas进行地理空间数据可视化

大家好&#xff0c;在当今数据驱动的世界中&#xff0c;将信息可视化到地图上可以提供有价值的见解&#xff0c;帮助有效地传达复杂的模式。GeoPandas是一个建立在pandas和shapely之上的Python库&#xff0c;使用户能够通过将地理空间数据与各种变量合并来创建令人惊叹的地图。…

深度学习(23)——YOLO系列(2)

深度学习&#xff08;23&#xff09;——YOLO系列&#xff08;2&#xff09; 文章目录 深度学习&#xff08;23&#xff09;——YOLO系列&#xff08;2&#xff09;1. model2. dataset3. utils4. test/detect5. detect全过程 今天先写YOLO v3的代码&#xff0c;后面再出v5&…

C语言:猜凶手

题目&#xff1a; 日本某地发生了一件谋杀案&#xff0c;警察通过排查确定杀人凶手必为4个嫌疑犯的一个。 以下为4个嫌疑犯的供词: A说&#xff1a;不是我。 B说&#xff1a;是C。 C说&#xff1a;是D。 D说&#xff1a;C在胡说 已知3个人说了真话&#xff0c;1个人说的是假话。…

2023,中国电商重回元老时代

中国的历史上不缺“太上皇”&#xff0c;但“太上皇”再度站到台前的很少。公元1457年&#xff0c;被囚禁在南宫的“太上皇”朱祁镇复位&#xff0c;上演了中国历史上少见的南宫复辟。而危机时刻被推举为皇帝的朱祁钰&#xff0c;后来的庙号是代宗&#xff0c;阴阳怪气十足。 …