数据分析案例-2024 年热门动漫数据集可视化分析

 

🤵‍♂️ 个人主页:@艾派森的个人主页

✍🏻作者简介:Python学习者
🐋 希望大家多多支持,我们一起进步!😄
如果文章对你有帮助的话,
欢迎评论 💬点赞👍🏻 收藏 📂加关注+


目录

1.项目背景

2.数据集介绍

3.技术工具

4.导入数据

5.数据可视化

源代码


1.项目背景

        近年来,随着互联网的飞速发展和数字技术的不断创新,动漫作为一种独特的文化形式,在全球范围内获得了空前的关注度和影响力。动漫不仅成为了年轻一代娱乐生活的重要组成部分,还逐渐渗透到教育、广告、游戏等多个领域,形成了一个庞大的产业链。

        特别是在2024年,随着5G、AI、大数据等新一代信息技术的深入应用,动漫产业的数字化、智能化水平得到了显著提升。动漫作品的创作、传播和消费方式都发生了深刻变化,为动漫产业的进一步发展提供了广阔的空间和可能。

        然而,与此同时,动漫市场的竞争也日益激烈,各类动漫作品层出不穷,观众对于动漫作品的需求也日益多样化和个性化。在这样的背景下,如何准确把握动漫市场的脉搏,了解观众的需求和喜好,成为了动漫产业发展的重要课题。

        因此,本研究旨在通过对2024年热门动漫数据集的可视化分析,深入探究动漫市场的发展趋势和规律,为动漫产业的决策者提供有价值的参考和启示。

2.数据集介绍

        本数据集来源于Kaggle,原始数据集共有1000条,22个变量。该数据集全面概述了 2024 年热门动漫,对于构建推荐系统、可视化动漫流行度和评分趋势、预测评分和流行度等非常有用。

该数据集包含 22 个特征:

Score:分配给每个动漫标题的评级或分数。

Popularity:衡量每部动漫在观众中的受欢迎程度。

Rank:数据集中每个动漫标题的排名。

Members:与每部动漫相关的会员或观众数量。

Description:每部动漫的情节和主题的简要概述或摘要。

Synonyms:每部动漫使用的替代标题或同义词。

Japanese:日语动画的原始标题。

English:动画的英文翻译标题。

Type:动漫类型的分类(例如电视剧、电影、OVA 等)。

Episodes:每个动漫系列的总集数。

Status:动画的当前状态(例如,正在进行、已完成等)。

Aired:动画播出的日期范围。

Premiered:动画首次首播的日期。

Broadcast:有关广播平台或频道的信息。

Producers:参与制作动画的公司或工作室。

Licensors:拥有动漫许可权的组织或公司。

Studios:负责制作动画的动画工作室。

Source:动漫的原始来源材料(例如漫画、小说、原创)。

Genres:动漫所属的类别或流派。

Demographic:动漫的目标受众群体。

Duration:每集或电影的持续时间。

Rating:分配给每个动漫的内容评级(例如,G、PG、PG-13、R)。

3.技术工具

Python版本:3.9

代码编辑器:jupyter notebook

4.导入数据

首先导入数据可视化的库,并加载数据集

查看数据集大小 

查看数据基本信息

查看数值型变量的描述性统计

查看非数值型变量的描述性统计

5.数据可视化

源代码

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')

anime_data = pd.read_csv("Top_Anime_data.csv")
anime_data.head()
anime_data.shape
anime_data.info()
anime_data.describe()
anime_data.describe(include='O').T
# 分数分布
plt.figure(figsize=(10, 6))
sns.histplot(anime_data['Score'], bins=30, kde=True, color='skyblue')
plt.title('Distribution of Scores')
plt.xlabel('Score')
plt.ylabel('Frequency')
plt.show()
# 受欢迎程度分布
plt.figure(figsize=(10, 6))
sns.histplot(anime_data['Popularity'], bins=30, kde=True, color='orange')
plt.title('Popularity Distribution')
plt.xlabel('Popularity')
plt.ylabel('Frequency')
plt.show()
# 类型分布
genres = anime_data['Genres'].str.split(',').explode().str.strip()
plt.figure(figsize=(12, 8))
sns.countplot(y=genres, order=genres.value_counts().index[:15], palette='muted')
plt.title('Top 15 Genres Distribution')
plt.xlabel('Count')
plt.ylabel('Genre')
plt.show()
# 分数与人气的散点图
plt.figure(figsize=(10, 6))
sns.scatterplot(x='Score', y='Popularity', data=anime_data, alpha=0.7)
plt.title('Score vs. Popularity')
plt.xlabel('Score')
plt.ylabel('Popularity')
plt.show()
# 排名前十的生产商
top_producers = anime_data['Producers'].str.split(',').explode().value_counts().head(10)
plt.figure(figsize=(10, 6))
sns.barplot(x=top_producers.values, y=top_producers.index, palette='husl')
plt.title('Top 10 Producers by Count')
plt.xlabel('Count')
plt.ylabel('Producer')
plt.show()
# 动漫人口分布
anime_data["Demographic"].value_counts().plot.pie(figsize=(10,5))
plt.title("Distribution of Anime Demographic", loc='center',
          color='red', fontsize=10, fontweight='bold')
plt.show()
labels=['Teens 13 or older', 'violence & profanity', 'Mild Nudity', 'All Ages', 'Children']
colors=['Pink','Yellow','Orange','Blue','Red']
plt.pie(anime_data["Rating"].value_counts(), labels=labels, colors=colors)
plt.axis('equal')
plt.title("Rating", loc='center', color='Blue', fontsize='15')
plt.gca().add_artist(plt.Circle(xy=(0,0),radius=0.75, facecolor='white'))
plt.show()
# 分数类别与来源的标准化交叉拟合
bins = [7.8, 7.9, 8.1, 8.3,9.4]
labels = ['7.8 to 7.9', '7.9 to 8.1','8.1 to 8.3','8.3 to 9.4']
anime_data['Score_Category'] = pd.cut(anime_data['Score'], bins=bins, labels=labels, right=False)
normalised_df = (pd.crosstab(anime_data["Score_Category"],anime_data["Source"],normalize="index")*100).round(2)
normalised_df.plot(kind="bar",stacked=True)
plt.xlabel('Score Category')
plt.ylabel('Percentage')
plt.title('Normalized Crosstabulation of Score Category and Source')
plt.legend(title='Source', bbox_to_anchor=(1.05, 1), loc='upper left')
plt.tight_layout()
plt.show()
# 收视人数与收视率的标准化交叉校正
bins = [1.0, 500.0, 1000.0]
labels = ['1 to 500', '500 to 1000']
anime_data['Members_category'] = pd.cut(anime_data['Members'], bins=bins, labels=labels, right=False)
(pd.crosstab(anime_data["Members_category"],anime_data["Rating"],normalize="index")*100).round(2).plot(kind="bar",stacked=True)
plt.title('Normalized Crosstabulation of Number of Viewers and Rating')
plt.legend(title='Rating', bbox_to_anchor=(1.05, 1), loc='upper left')
plt.tight_layout()
plt.show()
# 5大制作公司
anime_data["Studios"].value_counts().head(5).plot(kind="pie",autopct='%1.1f%%')
plt.title("Top 5 Production Houses")
plt.ylabel('')
plt.show()
# 疯人院制作的顶级动画
anime_data[anime_data["Studios"] == "Madhouse"]["Rating"].value_counts().plot(kind="pie",autopct='%1.1f%%')
plt.title("Top Anime produced by Madhouse")
plt.show()

资料获取,更多粉丝福利,关注下方公众号获取

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/803003.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

黑马点评-Postman卡住sending Requst原因解决

不知道为什么,用这个c1e1d5的token就会一直卡死,但是换了一个token就解决了,目前不知道为什么 解决了,原来是这个请求下面的函数发生了死循环!!太瓜皮了我超! 把num写成了count,导…

7月18日Workshop新加坡专场:在Sui上创建您自己的token

您是base在新加坡🇸🇬的开发者吗? 您是否觉得编程课程枯燥乏味?🤔 那么,Sui和Metaschool将一起来为您的学习增添乐趣! 欢迎加入我们特别为Web3初学者、开发者设组织的“在Sui上创建您自己的t…

linux下Jenkins的安装部署

前言: 用docker安装Jenkins非常方便快捷,但是最近国内的docker镜像源都不好用了,这里回顾一下最原始的Jenkins安装方式 安装前准备 安装环境 Jenkins的运行依赖java环境,linux下jdk的安装参考:linux下JDK的安装-CSD…

2024“狮舞齐鲁”南北狮王争霸赛在临沭开锣

锣鼓声声,狮王争霸。5月2日,临沭县红色朱村旅游区内人头攒动,热闹非凡。备受瞩目的“狮舞齐鲁”南北狮王争霸赛在此开赛,吸引了来自山东省的40支队伍、400余名参赛选手齐聚一堂,共同献上一场精彩绝伦的舞狮盛宴。 此次…

检测机构的配方分析是怎样?

检测机构配方分析是指检测机构通过对样品的化学成分、结构和性质进行分析,以确定其组成和配方的一种服务。检测机构通常提供以下服务: 1. 样品采集与前处理:检测机构通常会指导客户采集具有代表性的样品,并进行必要的前处理&#…

Blender练习,凳面以及凳脚的制作

目录 ​ 1.凳面的制作 2.制作坐垫下面的两条杠 3.制作桌腿 要制作的凳子如图,可以看到,它是一个由长方体,圆柱体等多种几何图形合成的一个立体图形 1.凳面的制作 shifta创建一个正方体 ctrltab打开一个弹窗,选择编辑模式。…

Linux离线安装Mysql5.7

Linux之Mysql安装配置 第一种:Linux离线安装Mysql(提前手动下载好tar.gz包) 第二种:通过yum安装配置Mysql(服务器有网络) 之前在阿里云上采用yum安装过一次(请看这里),…

区块链资料

Quantstamp - Public Security Assessments smart-contract-sanctuary-bsc/contracts/mainnet at master tintinweb/smart-contract-sanctuary-bsc GitHub https://github.com/slowmist/Cryptocurrency-Security-Audit-Guide/blob/main/README_CN.md sFuzz: 高效自适应的智…

SpringBoot结合ip2region实现博客评论显示IP属地

你好呀,我是小邹。 在现代的Web应用中,特别是博客和论坛类网站,为用户提供地理定位服务(如显示用户所在地理位置)可以极大地增强用户体验。本文将详细探讨如何使用Java和相关技术栈来实现在博客评论中显示用户的地址信…

大雾弥散动态特效404单页源码

源码介绍 大雾弥散动态特效404单页源码,跟随鼠标反向移动,可以做网站错误页或者丢失页面,将下面的代码放到空白的HTML里面,然后上传到服务器里面,设置好重定向即可 效果预览 完整源码 <!DOCTYPE html> <html><head><meta charset="utf-8&quo…

react自定义校验报错问题修复 ProFormText

1、以下是tsx组件 自定义校验告警导致表单无法提交问题修复 修改如下&#xff1a;

Spring使用外部的属性文件

首先&#xff0c; 我们在Spring里配置一个数据源Datasource&#xff0c;看具体代码&#xff1a; 我们说这样配置数据源&#xff0c;是可以实现&#xff0c; 但是我们不建议讲数据源配置在Spring的配置文件里&#xff0c;因为&#xff0c;这里会配置很多bean&#xff0c;而我们的…

W外链创建抖音私信卡片教程,私信卡片跳转微信工具

W外链地址wai.cn 在数字化时代的浪潮中&#xff0c;私域流量的价值愈发凸显&#xff0c;成为企业获取用户、建立品牌忠诚度、提升转化率的关键手段。抖音&#xff0c;作为当下最热门的短视频社交平台之一&#xff0c;其用户基数庞大、互动性强&#xff0c;为企业私域引流提供了…

爬虫(一)——爬取快手无水印视频

前言 最近对爬虫比较感兴趣&#xff0c;于是浅浅学习了一些关于爬虫的知识。爬虫可以实现很多功能&#xff0c;非常有意思&#xff0c;在这里也分享给大家。由于爬虫能实现的功能太多&#xff0c;而且具体的实现方式也有所不同&#xff0c;所以这里开辟了一个新的系列——爬虫…

FY4B卫星L2级产品掌握和python处理

废话不多说&#xff0c;展示二级产品CTT为例&#xff1a; 抱歉没空了解FY4B产品情况了&#xff0c;直接看代码 # CTT色标配置 bounds_CTT [180, 200, 220, 240, 260, 280, 300, 320] # 根据你的数据设定 colors_CTT [(0, 0, 139/255),(10/255, 0, 245/255),(0, 164/255, 2…

C语言——详解二维数组中元素的地址

在C语言中&#xff0c;二维数组元素的地址认知是一个相对复杂但重要的概念。以下是对二维数组中元素地址认知的详细叙述&#xff1a; 一、二维数组的基本构成 二维数组可以被看作是由多个一维数组组成的数组。例如&#xff0c;定义了一个3行4列的二维数组&#xff0c; int a…

实战分享:利用百数实现通讯录与表单无缝对接,提升管理效率

百数的通讯录实时同步到表单功能&#xff0c;实现了员工信息的即时更新与自动整合&#xff0c;不仅极大地提升了信息管理的效率与准确性&#xff0c;还为企业提供了便捷的数据分析基础&#xff0c;助力企业更高效地运营与决策。 设置方式 在企业管理中&#xff0c;开启通讯录…

深度学习入门——神经网络

前言 神经网络可以帮助自动化设定权重 具体地讲&#xff0c;神经网络的一个重要性质是它可以自动地从数据中学习到合适的权重参数 从感知机到神经网络 神经网络的例子 中间层aka隐藏层 复习感知机 偏置b 并没有被画出来。如果要明确地表示出b&#xff0c;可以像图3-3那样做…

redis基本类型和订阅

redis-cli -h <host> -p <port> -a <password> 其中&#xff0c;< host>是Redis服务器的主机名或IP地址&#xff0c;< port>是Redis服务器的端口号&#xff0c;< password>是Redis服务器的密码&#xff08;如果有的话&#xff09;。 set …

多模态大模型--音频文本

音频信息 声学 音频编解码技术的目标是&#xff0c;通过减少音频文件的大小来节省存储空间或减轻网络传输的负担。理想的情况下&#xff0c;即使音频被压缩&#xff0c;我们听到的声音与原版也应该没有任何区别。 Opus是一个多才多艺的音频编解码器&#xff0c;它适用于各种应…