基于标签的协同过滤算法实现与个人兴趣相关的文章推荐

在这里插入图片描述

一、前言

在当前信息爆炸的时代,每天都会涌现出大量的文章,人们有时候会感到信息的获取难度比筛选更大。而作为信息的提供者,我们应当为用户提供依据个人兴趣的文章推荐。

本项目中的文章标签相似度推荐功能使用了一种基于标签的协同过滤算法。具体地,我们先计算每篇文章的标签,然后计算出两篇文章之间的标签相似度,最后根据用户阅读过的文章,找到与之最相似的文章,推荐给用户。

下面是使用Java实现计算标签相似度的示例代码:

/**
 * 计算标签之间的相似度
 */
private double calculateSimilarity(List<String> tags1, List<String> tags2) {
  Set<String> set1 = new HashSet<>(tags1);
  Set<String> set2 = new HashSet<>(tags2);
  // 计算并集大小
  int unionSize = set1.size() + set2.size();
  set1.addAll(set2);
  // 计算交集大小
  int intersectSize = unionSize - set1.size();
  return (double) intersectSize / unionSize;
}

该方法以两个标签集合为参数,先将它们转化为Set,然后计算它们的并集和交集的大小,最后返回它们的相似度。

需要注意的是,这个算法实现会出现冷启动问题,即对于用户没有阅读记录的情况,我们无法根据它的阅读历史推荐文章。可以在这种情况下,使用一些简单的推荐策略,如热门文章推荐等。

二、后端开发

1. 框架和工具选择

本项目使用SpringBoot、SpringMVC和Mybatis-Plus构建后端。SpringBoot简化了Spring应用程序的搭建,SpringMVC是Spring的Web框架,Mybatis-Plus是Mybatis的增强工具。

2. 数据库设计

在本项目中,我们需要存储文章和用户的相关信息。具体的设计如下:

文章表(article):

字段名字段类型描述
idLong主键
titleString文章标题
authorString文章作者
contentString文章内容
create_timeDate发布时间
categoryString文章分类

用户表(user):

字段名字段类型描述
idLong主键
usernameString用户名
passwordString密码
emailString邮箱
create_timeDate注册时间

用户-文章表(user_article):

字段名字段类型描述
idLong主键
user_idLong用户id
article_idLong文章id
create_timeDate阅读时间

3. 接口设计

本项目共有以下接口:

注册接口(POST /user/register):用户注册接口,参数为用户名、密码、邮箱。

登录接口(POST /user/login):用户登录接口,参数为用户名和密码。

获取文章列表接口(GET /article/list):获取所有文章列表。

获取用户阅读历史接口(GET /user/history):获取用户阅读历史。

获取推荐文章接口(POST /article/recommend):获取推荐文章,参数为用户id。

4. 实现逻辑

用户注册接口:

前端请求:

axios.post('/user/register', {
  username: 'username',
  password: 'password',
  email: 'email'
}).then(res => {
  console.log(res.data)
})

后端实现:

@PostMapping("/register")
public Result registerUser(@RequestBody User user) {
  User existUser = userService.findUserByUsername(user.getUsername());
  if (existUser != null) {
    return Result.error("该用户名已被注册");
  }
  user.setPassword(DigestUtils.md5DigestAsHex(user.getPassword().getBytes()));
  userService.saveUser(user);
  return Result.success("注册成功");
}

用户登录接口:

前端请求:

axios.post('/user/login', {
  username: 'username',
  password: 'password'
}).then(res => {
  console.log(res.data)
})

后端实现:

@PostMapping("/login")
public Result loginUser(@RequestBody User user) {
  User existUser = userService.findUserByUsername(user.getUsername());
  if (existUser == null) {
    return Result.error("该用户不存在");
  }
  if (!existUser.getPassword().equals(DigestUtils.md5DigestAsHex(user.getPassword().getBytes()))) {
    return Result.error("密码错误");
  }
  String token = JwtUtil.createToken(existUser.getId(), existUser.getUsername());
  return Result.success(token);
}

获取文章列表接口:

前端请求:

axios.get('/article/list').then(res => {
  console.log(res.data)
})

后端实现:

@GetMapping("/getArticles")
public Result getArticles() {
  List<Article> articles = articleService.findArticles();
  return Result.success(articles);
}

获取用户阅读历史接口以及前端请求:

需要在请求头中添加token。

axios.get('/user/history', {
  headers: {
    'Authorization': 'Bearer ' + token
  }
}).then(res => {
  console.log(res.data)
})

后端实现:

@GetMapping("/history")
public Result getUserHistory(HttpServletRequest request) {
  Long userId = JwtUtil.getUserId(request.getHeader("Authorization"));
  List<UserArticle> userArticles = userArticleService.findUserArticlesByUserId(userId);
  List<Article> articles = new ArrayList<>();
  for (UserArticle userArticle : userArticles) {
    Article article = articleService.findArticleById(userArticle.getArticleId());
    articles.add(article);
  }
  return Result.success(articles);
}

获取推荐文章接口以及前端请求:

需要在请求头中添加token。

axios.post('/article/recommend', {
  user_id: userId
}, {
  headers: {
    'Authorization': 'Bearer ' + token
  }
}).then(res => {
  console.log(res.data)
})

后端实现:

@PostMapping("/recommend")
public Result recommendArticles(@RequestBody Map<String, Long> paramMap, HttpServletRequest request) {
  Long userId = paramMap.get("user_id");
  List<Article> articles = articleService.recommendArticles(userId);
  return Result.success(articles);
}

文章推荐功能的实现基于用户的阅读历史推荐和文章的标签相似度推荐。

用户阅读历史推荐的实现:

查询出用户阅读历史,根据文章分类和阅读时间排序,取出前10篇文章作为推荐文章。

public List<Article> recommendArticles(Long userId) {
  // 获取用户阅读历史
  List<UserArticle> userArticles = userArticleService.findUserArticlesByUserId(userId);
  List<Long> articleIds = userArticles.stream().map(UserArticle::getArticleId).collect(Collectors.toList());
  // 如果用户没有阅读历史,则按文章分类排序,取前10篇文章
  if (articleIds.isEmpty()) {
    return articleMapper.selectList(new QueryWrapper<Article>().orderByDesc("create_time").last("limit 10"));
  }
  // 根据文章分类和阅读时间排序,取前10篇文章
  return articleMapper.selectList(new QueryWrapper<Article>().in("id", articleIds)
                      .orderByDesc("create_time", "category").last("limit 10"));
}

文章标签相似度推荐的实现:

计算文章之间的标签相似度,取出与用户阅读过的文章最相似的前10篇文章作为推荐文章。

public List<Article> recommendArticles(Long userId) {
  // 获取用户阅读历史
  List<UserArticle> userArticles = userArticleService.findUserArticlesByUserId(userId);
  List<Long> articleIds = userArticles.stream().map(UserArticle::getArticleId).collect(Collectors.toList());
  // 如果用户没有阅读历史,则按文章分类排序,取前10篇文章
  if (articleIds.isEmpty()) {
    return articleMapper.selectList(new QueryWrapper<Article>().orderByDesc("create_time").last("limit 10"));
  }
  // 根据文章分类和阅读时间排序,取前10篇文章
  List<Article> articles = articleMapper.selectList(new QueryWrapper<Article>().in("id", articleIds)
                      .orderByDesc("create_time", "category").last("limit 10"));
  // 计算文章之间的标签相似度
  for (Article article : articles) {
    List<String> articleTags = Arrays.asList(article.getTags().split(","));
    for (Article a : articles) {
      if (a.getId().equals(article.getId())) {
        continue;
      }
      List<String> tags = Arrays.asList(a.getTags().split(","));
      double similarity = calculateSimilarity(articleTags, tags);
      a.setSimilarity(similarity);
    }
  }
  // 取出与用户阅读过的文章最相似的前10篇文章作为推荐文章
  List<Long> readArticleIds = userArticles.stream().map(UserArticle::getArticleId).collect(Collectors.toList());
  List<Article> recommendArticles = articles.stream()
                                        .filter(article -> !readArticleIds.contains(article.getId()))
                                        .sorted(Comparator.comparingDouble(Article::getSimilarity).reversed())
                                        .limit(10)
                                        .collect(Collectors.toList());
  return recommendArticles;
}

/**
 * 计算标签之间的相似度
 */
private double calculateSimilarity(List<String> tags1, List<String> tags2) {
  Set<String> set1 = new HashSet<>(tags1);
  Set<String> set2 = new HashSet<>(tags2);
  // 计算并集大小
  int unionSize = set1.size() + set2.size();
  set1.addAll(set2);
  // 计算交集大小
  int intersectSize = unionSize - set1.size();
  return (double) intersectSize / unionSize;
}

三、前端开发

1. 框架和工具选择

本项目使用VUE框架开发前端页面,同时使用axios库进行接口请求。

2. 页面设计

本项目共有以下页面:

登录页面(login):用户登录页面,包含用户名和密码输入框及登录按钮。

注册页面(register):用户注册页面,包含用户名、密码、邮箱输入框及注册按钮。

文章列表页面(article-list):展示所有文章列表。

用户阅读历史页面(user-history):展示用户的阅读历史列表。

推荐文章页面(recommend-articles):展示推荐给用户的文章列表。

3. 实现流程

登录页面:

登录界面,用户在该界面输入用户名和密码,请求后端登录接口,得到token以便后续接口请求。

注册页面:

注册界面,用户在该界面输入用户名、密码、邮箱,请求后端注册接口。

文章列表页面:

展示所有文章列表,用户点击文章标题可以进入文章详情页面。

用户阅读历史页面:

展示用户的阅读历史列表,用户可以查看阅读历史记录。

推荐文章页面:

展示推荐给用户的文章列表,根据后端推荐接口的返回结果展示。

四、总结

本篇博文详细介绍了如何使用SpringBoot、SpringMVC和Mybatis-Plus构建后端,使用VUE框架开发前端页面,以及如何实现文章推荐功能的详细流程和代码。

文章推荐功能的实现是基于用户阅读历史推荐和文章的标签相似度推荐,可以帮助用户更方便地获取到自己感兴趣的文章。

感谢您的阅读!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/18268.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Java版本的工程项目管理系统源代码之工程项目管理系统面临的挑战

​ ​工程项目管理系统是指从事工程项目管理的企业&#xff08;以下简称工程项目管理企业&#xff09;受业主委托&#xff0c;按照合同约定&#xff0c;代表业主对工程项目的组织实施进行全过程或若干阶段的管理和服务。 ​系统定义 工程项目管理企业不直接与该工程项目的总承包…

易视腾iS-E5-NGH_3798MV100_MT7601_卡刷固件包_当贝纯净桌面

易视腾iS-E5-NGH_3798MV100_MT7601_卡刷固件包_当贝纯净桌面 特点&#xff1a; 1、适用于对应型号的电视盒子刷机&#xff1b; 2、开放原厂固件屏蔽的市场安装和u盘安装apk&#xff1b; 3、修改dns&#xff0c;三网通用&#xff1b; 4、大量精简内置的没用的软件&#xff0…

产品经理 - 原型图设计软件

原型图设计软件哪个好用&#xff1f;6款好用软件推荐&#xff01; - 知乎 原型图都可以用什么软件做&#xff1f;11款好用软件分享&#xff01; 摩客, 墨刀 2014 墨刀是A股上市公司万兴科技旗下的在线一体化产品设计协作平台 即时设计是一款支持在线协作的专业级 UI 设计工…

回首来路多感概,最是奋斗动人心。

我们必需要在不同的时代有不同的领悟&#xff0c;才能充满生机地去迎接生命中每个新的开始。 文章目录 前言 初心 成长 收获 憧憬 出发 前言 今天是我成为csdn创作者一周年纪念日&#xff0c;我非常开心能够和大家分享我的写作之旅。在这一年里&#xff0c;我经历了许多挑…

QT QGraphicsView 提升到 QChartView报错 解决方案

QT QGraphicsView 提升到 QChartView报错 解决方案 本文主要描述, 使用QT提供的QChartView来绘制图表,提升QGraphicsView控件继承QChartView后,然后将QGraphicsView提升到我们自己写的类,怎么才能确保提升后编译不报错. [问题描述] 使用QGraphicsView显示图表的时候,我们需要将…

基于 TiDB + Flink 实现的滑动窗口实时累计指标算法

作者&#xff1a;李文杰 前言 在不少的支付分析场景里&#xff0c;大部分累计值指标可以通过 Tn 的方式计算得到 。随着行业大环境由增量市场转为存量市场&#xff0c;产品的运营要求更加精细化、更快速反应&#xff0c;这对各项数据指标的实时性要求已经越来越高。产品如果能…

WRF模式

随着生态文明建设和“碳中和”战略的持续推进&#xff0c;我国及全球气候变化及应对是政府、科学界及商业界关注的焦点。气候是多个领域&#xff08;生态、水资源、风资源及碳中和等问题&#xff09;的主要驱动因素&#xff0c;合理认知气候变化有利于解释生态环境变化机理及过…

使用SaleSmartly自动化流程的 5 个原因

想象一下&#xff0c;如果您可以采用智能数字解决方案来减轻团队和公司的手动和重复业务流程负担。它可以帮助您节省时间、提高公司的底线、消除冗余并增强数据管理。SaleSmartly&#xff08;ss客服&#xff09;就是这样。 通过利用自动化的力量&#xff0c;SaleSmartly&#x…

【Java】继承和多态

文章目录 一、继承1.继承的例子&#xff08;is-a&#xff09;2.组合的例子&#xff08;has-a&#xff09; 二、多态1.重写2.重载 三、继承的语法四、继承的注意事项1.初始化的顺序&#xff1a;2.super关键字 五、继承访问限定符六、多态实现方式七、多态的理解注意事项&#xf…

MGV2000_2+16_当贝纯净桌面卡刷固件包-内有教程

MGV2000_216_当贝纯净桌面卡刷固件包-内有教程 特点&#xff1a; 1、适用于对应型号的电视盒子刷机&#xff1b; 2、开放原厂固件屏蔽的市场安装和u盘安装apk&#xff1b; 3、修改dns&#xff0c;三网通用&#xff1b; 4、大量精简内置的没用的软件&#xff0c;运行速度提…

Python爬虫入门之爬虫解析提取数据的四种方法

本文主要介绍了Python爬虫入门之爬虫解析提取数据的四种方法&#xff0c;通过具体的内容向大家展现&#xff0c;希望对大家Python爬虫的学习有所帮助。 基础爬虫的固定模式 笔者这里所谈的基础爬虫&#xff0c;指的是不需要处理像异步加载、验证码、代理等高阶爬虫技术的爬虫…

数据结构之队列,实现队列的增删改查

目录 一、队列的定义 二、队列的实现 1.使用链表来实现队列 2.实现队列的接口 初始化队列 void QueueInit(Queue *pq) 队尾入队列 void QueuePush(Queue *pq,QDataType data) 队头出队列 void QueuePop(Queue *pq) 获取队列头部元素 QDataType QueueFront(Queue *pq) …

2D火焰特效

Unity面片实现火焰效果 一、效果说明 大家好&#xff0c;我是阿赵。这是一个火焰的效&#xff0c;不过它不是粒子做的&#xff0c;是用一个面片做的&#xff0c;可以理解成是2D的特效。这个例子很简单&#xff0c;但可以拓展一下思路&#xff0c;原来除了用序列帧和粒子做动画…

Cadence Allegro BGA类器件扇孔操作教程

对于BGA扇孔&#xff0c;同样过孔不宜打孔在焊盘上&#xff0c;推荐打孔在两个焊盘的中间位置。很多工程师为了出线方便&#xff0c;随意挪动BGA里面过孔的位置&#xff0c;甚至打在焊盘上面&#xff0c;如图1所示&#xff0c;从而造成BGA区域过孔不规则&#xff0c;易造成后期…

行为型模式-中介者模式

中介者模式 概述 一般来说&#xff0c;同事类之间的关系是比较复杂的&#xff0c;多个同事类之间互相关联时&#xff0c;他们之间的关系会呈现为复杂的网状结构&#xff0c;这是一种过度耦合的架构&#xff0c;即不利于类的复用&#xff0c;也不稳定。例如在下左图中&#xf…

HR如何快速提升工作效率?

从招聘到用人管理各个环节&#xff0c;人力资源部门都是公司最重要的职能部门之一&#xff0c;hr的日常工作涉及众多复杂繁琐的内容&#xff0c;比如人员招聘&#xff0c;考核培训等都离不开大量的数据整理和录入操作&#xff0c;但那些和“人”相关的数据信息&#xff0c;经常…

SOFA Weekly|开源之夏 MOSN 与 Layotto 项目简介、社区会议预告、社区本周贡献

SOFA WEEKLY | 每周精选 筛选每周精华问答&#xff0c;同步开源进展 欢迎留言互动&#xff5e; SOFAStack&#xff08;Scalable Open Financial Architecture Stack&#xff09;是蚂蚁集团自主研发的金融级云原生架构&#xff0c;包含了构建金融级云原生架构所需的各个组件&am…

SpringCloud全面学习笔记之初尝美妙篇

目录 前言初识微服务单体架构分布式架构微服务架构初见SpringCloud微服务治理分布式服务架构案例 微服务组件及使用Eureka注册中心提供者和消费者Eureka的结构和作用搭建Eureka服务注册服务服务发现Eureka注册服务总结 Ribbon负载均衡原理负载均衡原理负载均衡策略懒加载 Nacos…

gtest之高级主题

目录 Value-Parameterized测试示例Value-Parameterized实现 类型测试Type-Parameterized Tests注册test程序获取当前测试程序名运行测试程序选项选择性测试重复测试无序执行分发到不同的机器控制输出Controlling How Failures Are Reported结合Sanitizer Value-Parameterized测…

MySQL读写分离

读写分离配置流程 master和slave机器的信息 IP地址&#xff1a; master&#xff08;centos7&#xff09;&#xff1a;192.168.131.129 slave&#xff08;win10&#xff09;&#xff1a;192.168.0.6 保证master和slave之间的网络互通&#xff0c;并且保证3306端口是开放的。 mas…