Novel Influence Maximization Algorithm for Social Network Behavior Management

Abstract:

   通过影响力最大化的过程来识别对社交网络中的产品采用或信息利用做出重大贡献的用户。社交网络的指数增长给这些网络的分析带来了一些挑战。现有文献非常重视对结构属性进行建模,而忽略了用户与其社会行为之间的关系。对于社会行为,本文将影响力最大化任务并行化。为了最大化社交网络中的影响力,提出了一种具有并行社交行为的基于兴趣的算法。该算法能够识别社交网络中有影响力的用户。用户的交互行为与用户的兴趣一起被动态地加权为社交行为。这两个语义度量用于所提出的算法中。通过社区结构实现具有完美并行性的CPU架构的机器,计算出最佳的影响力节点集。这有助于减少执行时间并克服现实社交网络规模的挑战。与现有方案相比,所提出的算法提高了现实世界网络上的计算速度。

关键词:行为属性、CPU架构、并行算法、影响力分析、社交网络分析

1. Introduction

  在过去的几年里,社交网络的用户数量以及每天的数据交换都呈爆炸性增长。信息可以快速到达大范围随着这些网络的人数快速增长[1]。存在多种分析该网络数据的方案,其中社会影响力分析是一种重要的方法。使用这种技术可以有效地利用大量的社交数据。政治运动、流行病爆发、新闻跟踪、营销设计以及具有高度影响力的网络的几个此类种子节点可以被识别用于多种实际应用[2]。代表小用户群的种子集是企业设计营销的目标,向他们的朋友圈做广告和推荐新产品,从而最大化产品用户群。在Covid-19和其他流行病爆发的情况下,社交网络可以帮助识别传染病及其影响,同时帮助政府采取控制措施[3]。

   用户受到选举候选人通过社交网络传播意识和信息的影响,在政治方面投票给他们[4]。通过社交网络影响力最大化(IM)是一种新的口碑信息传播意识形态。在特定的传播模型中,消息可以到达的总用户数在具有特定用户数量的网络上最大化[5]。该用户集的识别被定义为影响力最大化问题。在传统的扩散模型下,IM 是 NP 困难的。线性阈值(LT)和独立级联(IC)模型用于捕获种子及其对其他用户的动态影响。由于高度依赖,任务并行化在社交网络中具有挑战性[6]。根据影响力的传播情况,可以利用社区检测策略对网络进行适当的划分。

2. Related Works

  在社交网络分析中,发现具有重大影响力的有影响力的个体是一项重大挑战[7]。近年来,一些研究人员致力于解决影响力最大化(IM)问题。现有的关于 IM 问题的文献一般可以分为顺序算法和并行算法。节点影响能力的顺序确定是使用前一种算法来确定的[8]。在观察前n个节点的影响后,执行第(n+1)个节点选择。由于空间和时间复杂性高,在超大规模网络中,这些网络的利用给全局和集中控制带来了重大挑战。顺序算法是基于贪婪算法、基于网络节点拓扑定位并考虑影响最大化作为优化问题进行分类[9]。

    在贪婪算法的情况下,可以通过将每一阶段迭代获得的最佳局部选择收敛到全局选择来计算影响元素[10]。使用这些算法基于蒙特卡罗模拟来估计边际影响的准确分布。然而,这是一个耗时的过程。对于用贪心解法求解 IM 问题,提供了超过 60% 近似保证的最优解[11]。尽管该解决方案很有效,但它提供了近似值,并且在大规模社交网络中的链接之间具有较小的传播概率。与简单的贪婪算法相比,使用成本有效的惰性前向(CELF)技术[4],节点影响力传播的总计算量减少了 700 倍。通过称为 CELF++ 的改进 CELF 算法,避免了不必要的边际增益重新计算,提供了更生动、更好的评估。

    贪婪算法 - 实用分区和播种 (PrPaS),专注于最大化通常中等的社交网络影响。另一种可扩展且快速的贪婪算法,贪婪状态机(SMG)充当单个状态机,同时记录最终状态以及特定节点的影响传播值[12]。主导竞争影响力最大化 (DCIM) 算法与 CELF 相结合,在大规模网络中展现出高速度。最大似然、启发式聚类、初始多传播节点选择(IMSN)、度距离中心性、k-壳中心性和度折扣中心性度量用于识别有影响力的节点[13]。 H 指数、聚类系数、同伴行为和度中心性因子是用于衡量节点影响力的重要局部指标。

3. Proposed Work

   为了最大化社交网络中的影响力,提出了一种具有并行社交行为的基于兴趣的算法。该算法能够识别社交网络中有影响力的用户。为了解决社交网络上有影响力的用户的识别问题,利用了完整的CPU架构,以及网络语义和结构的结合[14]。用户的交互行为与用户的兴趣一起被动态地加权为社交行为。这两个语义指标在所提出的算法中使用。通过社区结构实现具有完美并行性的CPU架构的机器,计算出最佳的影响力节点集。这有助于减少执行时间并克服现实社交网络规模的挑战。影响力估计和影响力节点生成是该模型的两个主要阶段。分区图在每个节点处应用页面排名来计算模块串联操作的权重,如图1所示。

 为了计算影响力,基于用户兴趣和社交行为的社交行为与第一个模块中提出的算法相集成。每个用户的影响力是通过页面排名算法来估计的。在大图中,与基于度的中心性等其他工具相比,页面排名算法的排名分辨率更高。大规模网络问题可以通过并行计算页面排名来克服[15]。在页面排名的计算中观察到较高的数据依赖度,这是一个重大障碍。其他节点排名的估计对于计算节点排名至关重要。该算法基于连通结构,利用划分图原理来克服估计节点等级的问题。

4. Results and Discussion

   使用五种不同的算法来比较所提出算法的效率。选择的五种算法包括corenes中心性和k-sell类型的最新算法、页面排名和度类型的经典算法、并行模型、串行模型的并行版本以及基于社区检测和启发式策略的贪心算法。通过多样化的比较证明了该算法的优越性。使用 64GB 内存、基于 3 核 Intel 处理器的 64 位 Windows PC 来执行所有算法。 Java语言用于实现所提出的算法以及现有方案。

   图2提供了影响力在特定网络上传播的实验结果,该网络的规模从千到百万用户不等。测试平台的内存大小限制为64GB。使用影响广度优先搜索树概念可以从候选节点中有效地确定种子节点。该模型以空队列中的黑色顶点开始。从队列中提取第一个顶点时,所有未访问的邻居都会被访问并包含在队列中。距离数组存储每个顶点的距离从它的节点。最大似然影响最大化 (MLIM)、并行、线性规划 (LP)、coreness、混合整数非线性规划 (MINP)、BienstockZuckerberg (BZ)、混合整数规划 (MIP)、基于社会行动的影响力最大化 (SAIM)、取证基于调查(FBI)的算法等可以与本文提出的算法进行信息传播速度和效率的比较。通过严格观察,SAIM 方案中可以观察到更长的黑色路径和更相似的种子候选。

   分析了所提出算法的运行时复杂度,并与现有算法进行了比较。图 3 展示了所提出的算法在多个数据集和不同网络上的运行时间比较。从该图像中可以清楚地观察到所提出的算法在时间复杂度方面的效率。通过插入带有元编程表达式(例如用于创建并行算法的 API OpenMP)的源代码,可以促进并行性。所提出的模型使用并行计算来独立估计社区中每个节点的影响力,从而实现了有竞争力的计算效率。在不同规模的各种社交网络上,所提出的算法以最短的执行时间首先完成,而不影响结果。 Page Rank 算法被发现成本高昂,影响了计算效率系统。在所提出的算法中,可以对并行缩减、并行扫描、并行排序和此类有效基元进行变换,以显着提高计算效率。对于多CPU核,并行算法的加速增长因子如图4所示。随着CPU核数量的增加,加速因子呈次线性增长。

  所提出的算法使用 Higgs 和微博网络数据集证明了性能的提高。与使用较小内存的算法相比,所提出的算法的执行时间和影响范围更高。与其他算法相比,在 Twitter 数据集上使用某些语义属性时,时间消耗显着减少。为了识别有影响力的节点,并行性需要最少的努力以及并行算法的其他显着优点。在大规模网络中,应用并行性的概念来探索其操作。根据实验结果,在内存利用率和时间消耗方面,由于并行 CPU 以及加速的改进,有显着的改善。为了识别最有影响力的节点,传统的基于并行语义的方案利用了社会语义。然而,由于社交网络具有高度的数据依赖性,并且需要加大隐私保护的力度,因此也面临着一些缺点。

5. Conclusion

  为了最大化社交网络的影响力,提出了一种具有并行社交行为的基于兴趣的算法。在初始阶段设计新颖的并行框架,通过排除影响较小的节点来选择潜在的候选节点。图社区分解和采样方案构成了并行性的基础。进一步地,动态加权的社交行为以及用户兴趣是下一阶段呈现的社交行为的语义属性。个体从相似邻居处接收到的社交行为可以通过所提出的模型来区分。使用影响广度优先搜索树概念可以从候选节点中有效地确定种子节点。使用这种技术可以确保信息的快速传播。所提出的算法速度极快,需要更少的内存,时间效率高,并且克服了现有算法中的权衡。未来的工作重点是在大型网络中结合并行性实现剪枝算法。网络在时间、社会关系、社会行为和社区变化方面的动态演化也被建议通过自适应算法来解决。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/525635.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

基于Java+SpringBoot+vue3+uniapp点餐/外卖管理系统设计与实现

博主介绍:✌全网粉丝5W,全栈开发工程师,从事多年软件开发,在大厂呆过。持有软件中级、六级等证书。可提供微服务项目搭建与毕业项目实战,博主也曾写过优秀论文,查重率极低,在这方面有丰富的经验…

第九届蓝桥杯大赛个人赛省赛(软件类)真题C 语言 A 组-航班时间

#include<iostream> using namespace std;int getTime(){int h1, h2, m1, m2, s1, s2, d 0;//d一定初始化为0&#xff0c;以正确处理不跨天的情况 scanf("%d:%d:%d %d:%d:%d (%d)", &h1, &m1, &s1, &h2, &m2, &s2, &d);return d …

使用高德微信小程序插件实现精准获取打卡位置

由于微信小程序的 getFuzzyLocation 误差太大 不得不改用高德微信sdk 使用方法&#xff1a; 一、下载 sdk 相关下载-微信小程序插件 | 高德地图API 二、引入 sdk //引入 var amapFile require(../../libs/amap-wx.js); Page({onLoad: function() {var that this;va…

基于springboot+vue+Mysql的滴答拍摄影项目

开发语言&#xff1a;Java框架&#xff1a;springbootJDK版本&#xff1a;JDK1.8服务器&#xff1a;tomcat7数据库&#xff1a;mysql 5.7&#xff08;一定要5.7版本&#xff09;数据库工具&#xff1a;Navicat11开发软件&#xff1a;eclipse/myeclipse/ideaMaven包&#xff1a;…

组合数(费马小定理, 快速幂)

给定 n 组询问&#xff0c;每组询问给定两个整数 a&#xff0c;b&#xff0c;请你输出 Cbamod(1097)的值。 输入格式 第一行包含整数 n。 接下来 n 行&#xff0c;每行包含一组 a 和 b。 输出格式 共 n 行&#xff0c;每行输出一个询问的解。 数据范围 1≤n≤10000, 1≤…

战争中的AI应用:道德、伦理与技术的交织

AI在战争中的应用是一个极具争议和复杂的话题&#xff0c;无法简单地回答是好还是坏。其影响取决于多个因素&#xff0c;包括使用方式、目的、伦理框架以及技术本身的发展水平。 一方面&#xff0c;AI在战争中具有潜在的积极作用。它可以提高军事行动的效率和精确性&#xff0c…

持续交付工具Argo CD的部署使用

Background CI/CD&#xff08;Continuous Integration/Continuous Deployment&#xff09;是一种软件开发流程&#xff0c;旨在通过自动化和持续集成的方式提高软件交付的效率和质量。它包括持续集成&#xff08;CI&#xff09;和持续部署&#xff08;CD&#xff09;两个主要阶…

自然语言处理技术(Natural Language Processing)知识点

自然语言处理知识点 自然语言处理1. word2vec是什么2. 常用的NLP工具和软件3. 朴素贝叶斯分类器4. BiLSTM-CRF模型怎么去实现5. Bert模型实现NER6. 命名实体识别任务中&#xff0c;怎么去处理数据分布不均的问题&#xff1f;7. 用户问题检索相关文本时&#xff0c;具体都用了哪…

Mac下用adb命令安装apk到android设备笔记

查询了些资料记录备用。以下是在Mac上使用命令行安装APK文件的步骤&#xff1a; 1. 下载并安装ADB&#xff1a; 如果您的Mac上没有安装ADB&#xff0c;请从官方的Android开发者网站下载Android SDK Platform Tools&#xff1a;Android SDK Platform Tools。将下载的ZIP文件解…

KylinOS银河麒麟安装部署AI服务

KylinOS银河麒麟安装部署AI服务&#xff08;CPU版本&#xff09; 查看操作系统 [jnapp8160fcc7cf1b ~]$ nkvers ############## Kylin Linux Version ################# Release: Kylin Linux Advanced Server release V10 (Lance)Kernel: 6.2.0-36-genericBuild: Kylin Linux…

数据挖掘及其近年来研究热点介绍

&#x1f380;个人主页&#xff1a; https://zhangxiaoshu.blog.csdn.net &#x1f4e2;欢迎大家&#xff1a;关注&#x1f50d;点赞&#x1f44d;评论&#x1f4dd;收藏⭐️&#xff0c;如有错误敬请指正! &#x1f495;未来很长&#xff0c;值得我们全力奔赴更美好的生活&…

什么是mka音频格式?mp3与mka音频的区别 如何把mp3转成mka格式?

一&#xff0c;什么是mka音频格式 mka音频是一种音频文件格式&#xff0c;它是Matroska多媒体容器格式的一种变体&#xff0c;专门用于存储音频数据。mka文件通常包含压缩的音频流&#xff0c;如MP3、AAC或FLAC等&#xff0c;以及其他可能的元数据&#xff0c;如专辑封面、艺术…

24 个Intellij IDEA好用插件

24 个Intellij IDEA好用插件 一. 安装插件 Codota 代码智能提示插件 只要打出首字母就能联想出一整条语句&#xff0c;这也太智能了&#xff0c;还显示了每条语句使用频率。 原因是它学习了我的项目代码&#xff0c;总结出了我的代码偏好。 Key Promoter X 快捷键提示插件 …

基于ARM内核的智能手环(day7)

RTC&#xff08;实时时钟&#xff09; 什么是RTC&#xff1f; RTC是指实时时钟&#xff08;Real-Time Clock&#xff09;&#xff0c;是一种能够持续跟踪时间的计时器&#xff0c;即使在设备断电的情况下也能保持时间的准确性。它通常用于需要准确时间记录的应用&#xff0c;…

[每日算法 - 阿里机试] leetcode739. 每日温度

入口 力扣&#xff08;LeetCode&#xff09;官网 - 全球极客挚爱的技术成长平台备战技术面试&#xff1f;力扣提供海量技术面试资源&#xff0c;帮助你高效提升编程技能&#xff0c;轻松拿下世界 IT 名企 Dream Offer。https://leetcode.cn/problems/daily-temperatures/descr…

深度学习理论基础(七)Transformer编码器和解码器

学习目录&#xff1a; 深度学习理论基础&#xff08;一&#xff09;Python及Torch基础篇 深度学习理论基础&#xff08;二&#xff09;深度神经网络DNN 深度学习理论基础&#xff08;三&#xff09;封装数据集及手写数字识别 深度学习理论基础&#xff08;四&#xff09;Parse…

UE5、CesiumForUnreal实现加载建筑轮廓GeoJson数据生成白模功能

1.实现目标 在UE5.3中,通过加载本地建筑边界轮廓面GeoJson数据,获取底面轮廓和楼高数据,拉伸生成白模,并支持点选高亮。为防止阻塞Game线程,使用了异步任务进行优化,GIF动图如下所示: 其中建筑数量:128871,顶点索引数量:6695748,三角面数量:2231916,顶点数量:165…

golang 归并回源策略

前言 下面是我根据业务需求画了一个架构图&#xff0c;没有特别之处&#xff0c;很普通&#xff0c;都是我们常见的中间件&#xff0c;都是一些幂等性GET 请求。有一个地方很有意思&#xff0c;从service 分别有10000 qps 请求到Redis&#xff0c;并且它们的key 是一样的。这样…

CSS - 你遇到过动画卡顿的问题吗

难度级别:中高级及以上 提问概率:70% 回答这道题,首先要说的就是,浏览器在每一帧动画里大概做了什么事情。首先浏览器会执行Javascript,或是操作DOM元素,紧接着需要对DOM元素进行样式计算,当计算完成后,就需要针对DOM元素的位置以及大小…

2024年MathorCup妈妈杯数学建模思路D题思路解析+参考成品

1 赛题思路 (赛题出来以后第一时间在群内分享&#xff0c;点击下方群名片即可加群) 2 比赛日期和时间 报名截止时间&#xff1a;2024年4月11日&#xff08;周四&#xff09;12:00 比赛开始时间&#xff1a;2024年4月12日&#xff08;周五&#xff09;8:00 比赛结束时间&…