源码:用Python进行电影数据分析实战指南

源码:用Python进行电影数据分析实战指南

原创 IT小本本 IT小本本 2025年03月03日 22:28 北京

接上一篇文章:用Python进行电影数据分析实战指南

1、首先复制csv内容到csv文件中

2、接着创建.py文件复制源码内容

3、运行代码,就可以看到数据分析图啦

图片

图片

源码内容:

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# 1. 加载数据
def load_data(file_path):
    """
    从CSV文件加载电影数据集
    """
    df = pd.read_csv(file_path)
    print("数据维度:", df.shape)
    print("\n前5行数据:")
    print(df.head())
    print("\n数据摘要:")
    print(df.info())
    return df

# 2. 数据清洗
def clean_data(df):
    """
    数据清洗预处理
    """
    # 删除重复值
    df = df.drop_duplicates()
    
    # 处理缺失值
    df['rating'] = df['rating'].fillna(df['rating'].median())
    df = df.dropna(subset=['release_year', 'genre'])
    
    # 转换数据类型
    df['release_year'] = df['release_year'].astype(int)
    
    # 处理genre列(可能有多个类型)
    df['genre'] = df['genre'].str.split(',')
    
    return df

# 3. 数据分析
def analyze_data(df):
    """
    执行数据分析并生成可视化
    """
    # 设置可视化风格
    sns.set(style="whitegrid")
    plt.figure(figsize=(12, 6))
    
    # 分析1:电影类型分布
    genre_counts = df.explode('genre')['genre'].value_counts().head(10)
    plt.subplot(2, 2, 1)
    genre_counts.plot(kind='bar', color='skyblue')
    plt.title('Top 10 Movie Genres')
    plt.xlabel('Genre')
    plt.ylabel('Count')

    # 分析2:评分分布
    plt.subplot(2, 2, 2)
    sns.histplot(df['rating'], bins=20, kde=True, color='orange')
    plt.title('Rating Distribution')
    plt.xlabel('IMDB Rating')

    # 分析3:年度电影数量趋势
    yearly_counts = df.groupby('release_year').size()
    plt.subplot(2, 2, 3)
    yearly_counts.plot(color='green')
    plt.title('Movies Released by Year')
    plt.xlabel('Year')
    plt.ylabel('Number of Movies')

    # 分析4:评分与时长关系
    plt.subplot(2, 2, 4)
    sns.scatterplot(x='runtime', y='rating', data=df, alpha=0.6)
    plt.title('Runtime vs Rating')
    plt.xlabel('Runtime (minutes)')
    plt.ylabel('Rating')

    plt.tight_layout()
    plt.show()

    # 高级分析:相关系数矩阵
    numeric_df = df.select_dtypes(include=['float64', 'int64'])
    plt.figure(figsize=(10, 8))
    sns.heatmap(numeric_df.corr(), annot=True, cmap='coolwarm')
    plt.title('Correlation Matrix')
    plt.show()

# 主程序
if __name__ == "__main__":
    # 文件路径(需要替换为实际路径)
    file_path = "movies.csv"
    
    # 加载数据
    movie_df = load_data(file_path)
    
    # 数据清洗
    cleaned_df = clean_data(movie_df)
    
    # 数据分析
    analyze_data(cleaned_df)
    
    # 生成统计摘要
    print("\n统计摘要:")
    print(cleaned_df.describe())

csv内容:

title

rating

genre

release_year

runtime

votes

director

actors

Ne Zha: The Demon Boy Makes Havoc in the Sea

9.8

Animation 

2025

144

Jiaozi 

Product quite

5.1

Horror,Animation

1998

154

Wesley Weaver

Sheila Blackburn, Christina Harris, Jacob Odonnell

Choose support stuff

8

Action

1995

87

316631

Brian Vance, Karen Norris, Thomas West

Field itself growth

8.2

Thriller,Horror,Adventure

2007

163

398833

Daniel Kelly

Kenneth Jackson, Allen Campbell MD, Stacy Andersen

Task available president

6.7

Horror

2011

73

James Bishop, Rachel Williams, Cameron Wilson

Fly system event

8

Adventure

1997

178

290428

David Crawford

Randall Gonzalez, Larry Collins, Emily Sullivan

Evidence

9.4

Animation,Horror

1994

65

406310

Robert Lucas

Jeremiah Robinson, Megan Williams, Megan Herrera

Treat week

Comedy

2014

95

438314

Mitchell Dickson

Hailey Richardson, Nancy Davis, Cynthia Luna MD

Step staff

6

Comedy,Drama

2005

80

142530

Rebecca Wilson

Patrick Thompson, Amy Hernandez, Christopher King

Much such

7.8

Romance,Action,Horror

1992

163

141373

Kenneth Wang, April Avila, Adam Singleton

Wish water

7.8

Romance,Horror,Adventure

2015

173

241570

John Poole

Dr. Dennis Ryan, Vincent Valdez, John Rose

Two

8.7

Sci-Fi,Thriller,Documentary

2013

88

73525

Justin Turner

Andrew Coffey, Robin Jarvis, Daniel Murray

Someone song

Comedy

1999

140

Lisa Atkinson

James Brown, Cynthia Lopez, Jennifer Lopez

Culture quality

6.9

Adventure,Documentary,Sci-Fi

1990

147

358412

Michael Garrison

Robert Jenkins, Peter Combs, Charles Marsh DDS

Each listen and

8.8

Comedy,Sci-Fi

2017

80

379584

Michael Murphy

Rachel Reeves, David Matthews, Miss Dawn Hayes

Particular

7.5

Documentary

1996

171

442277

Rebecca Bryant DDS

Cody Cain, Dillon Powell, Kelsey Riley

Control lawyer

5.8

Documentary

2023

177

Chad Brown

Susan Morales, Michael Mann, Brian Hunter

Performance yourself then

Sci-Fi,Horror

1993

90

497474

Christopher Knapp, Edward Chapman PhD, Steven Richardson

Clearly

9.1

Drama,Animation,Adventure

2000

93

319029

Cynthia Harrison

Rodney Patterson, Shawn Wells, David Hill

Risk town

7.7

Horror,Sci-Fi,Thriller

2013

116

237708

Suzanne Smith

James Williams, Francisco Miller, Scott Herman

Once structure

6.7

Documentary,Horror,Animation

1990

69

31866

Mr. Jonathan Stafford

Pamela Johnson, John Rodriguez, Misty Wells

Condition morning

9.3

Documentary

2005

95

113321

Robert Jennings

James Williams, Antonio Zuniga, Adam Stewart

Lawyer almost method

9.4

Adventure,Horror,Animation

2016

84

Katherine Clark

Joshua Bernard, Jeffrey James, Cheryl Salinas

Central write

7.1

Action,Comedy,Animation

2015

153

452764

Joe Hernandez

Matthew Donaldson, Jennifer Kelley, Leslie Gomez

Apply window

7.7

Thriller

2001

95

459482

Logan Williams

Brooke Bruce, Danielle Dixon, Michael Burton

Trouble benefit another

9.3

Comedy,Action,Documentary

1995

178

124930

Christina Wood

Darren Jones, Brian Fischer, Paula Garcia

Represent career away

6.1

Action,Drama

2014

60

140042

Terri Melendez

Deanna Walker, Joseph Robinson, Mrs. Samantha Mccarthy

Product money

6.4

Documentary,Adventure,Drama

2002

97

31662

Paul Hale

Rachel Taylor, Lisa Hughes, Christopher Jordan

Standard campaign hot

8.7

Action

2020

124

279463

Evan Holmes

Madison Sanchez, Rachel Smith, Hannah Avery

Foreign care

5.4

Comedy

1994

146

212694

Alexander Morgan

Bill Doyle, Mary Garrison, Barbara Velazquez

Our of force

6.2

Action,Comedy,Thriller

2023

100

108090

Erica Mack

Cheryl Ray, Bobby Webster, Philip Mcdonald

Moment poor hour

6.3

Sci-Fi

2019

100

491594

Tyler Smith, Crystal Grimes, Amanda Watson

Science suffer human

10

Comedy

2003

124

490296

Nicole Evans

Karen Cook, Albert Tate, Teresa Watkins

Possible mission

Romance

2008

80

285802

Kyle Vasquez

Sonia Stanley, Dr. Olivia Sullivan, Tony Garcia

Factor difficult short

9.9

Documentary,Action,Sci-Fi

1996

180

139656

Terry Rogers

Felicia Dunn, Victor Spencer, Robert Mcdonald

Ready organization

7.8

Sci-Fi,Horror

2011

86

448171

Robert Green

Andrew Robinson, David Baker, Erik Jones

Right phone standard

9.5

Comedy

2017

166

2858

Kristin Montes

Thomas Martin, Amanda West, Patrick Travis

Start painting

9.9

Adventure

2017

131

Jesus Green, Robert Davis, Rebecca Davis

Whose member area

9.5

Action,Romance,Drama

2017

76

Mr. Martin Garcia

Tiffany Williams, Karen Ramirez, Lauren Matthews

Teach however

9.9

Romance

2003

147

54893

Melvin Medina

Shannon Bell, Jeffrey Hoffman, Samantha Walton

Within response one book

9.4

Drama,Horror,Animation

2001

172

95036

Latoya Petersen

Christina Pearson, Shawn Hart, Joseph Moore

Nation south debate

9.7

Horror,Sci-Fi,Drama

1996

108

451150

Paul Clark

Darrell Neal, Patrick Durham, Nathan Freeman

Method town firm

9.6

Sci-Fi,Horror

2004

63

209910

John King

Renee Williams, James Hunter, Lindsey Buchanan

Produce movie

9.8

Romance,Documentary

2015

146

282131

Daniel Diaz

Ashley Lara, Dustin Pearson, John Franklin

Best across

Drama,Sci-Fi

1992

73

182239

Debra Calderon

Deborah Hunter DVM, Peter Phillips, Donna Wright

Pass crime

8

Comedy,Thriller,Horror

2006

65

1886

Yolanda Baxter

Adam Hood, Edwin Henderson, Stephen Anderson

Move

8.4

Horror,Romance,Thriller

1994

145

327712

Roy Schwartz

Joann Fleming, Maria Simpson, John Mason

Where cause idea

8.6

Documentary,Sci-Fi

2016

101

156008

Wesley Turner

Dr. Carol Diaz, Daniel Santana, Tina White

Water concern

8.3

Drama,Sci-Fi

2015

130

160317

Nicole Martin

Corey Sanders, Rebecca Tran, Kari Mason

Degree you

7.9

Romance,Adventure,Documentary

2018

146

249085

Nicholas Lawson

Brian Robbins, Charles Schwartz, Shawn Ramos

Wonder firm pull

8.7

Comedy,Sci-Fi,Romance

1995

164

124138

Kelly Thomas

Holly Stark, Susan Bishop, Adam Perez

创作不易,从构思到成品,饱含我创作的热忱,希望大家尊重原创,拒绝抄袭、盗用!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/984231.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

GHCTF2025--Web

upload?SSTI! import os import refrom flask import Flask, request, jsonify,render_template_string,send_from_directory, abort,redirect from werkzeug.utils import secure_filename import os from werkzeug.utils import secure_filenameapp Flask(__name__)# 配置…

Unity Shader编程】之基础纹理

一,单张纹理 好的,用户想学习Unity Shader中的单张纹理章节。我需要根据提供的搜索结果来整理相关内容。首先,查看搜索结果中的相关部分,特别是‌、‌、‌、‌、‌这几条,因为它们提到了基础纹理、单张纹理的实现方法…

SpringBoot使用注解扫描注册Java Web三大组件

使用注解扫描和注册Java Web三大组件(Servlet、Filter、Listener)非常方便。 1. Servlet 注册 Servlet 是 Java Web 开发的基础组件,用于处理客户端(通常是浏览器)发送的 HTTP 请求并生成响应。 Controller是基于 Ser…

STM32F4 UDP组播通信:填一填ST官方HAL库的坑

先说写作本文的原因,由于开项目开发中需要用到UDP组播接收的功能,但是ST官方没有提供合适的参考,使用STM32CubeMX生成的代码也是不能直接使用的,而我在网上找了一大圈,也没有一个能够直接解决的方案,deepse…

JVM - 3.垃圾回收

1.垃圾收集的经典问题 1.哪些内存需要回收2.什么时候回收3.如何回收1.你知道哪几种垃圾回收器,各自的优缺点,重点讲一下cms和g12.JVM GC算法有哪些,目前的JDK版本采用什么回收算法3.G1回收器的回收过程 1.Java中垃圾的定义(Garbag…

重构谷粒商城09:人人开源框架的快速入门

谷粒商城09——人人开源框架的快速入门 前言:这个系列将使用最前沿的cursor作为辅助编程工具,来快速开发一些基础的编程项目。目的是为了在真实项目中,帮助初级程序员快速进阶,以最快的速度,效率,快速进阶…

css实现元素垂直居中显示的7种方式

文章目录 * [【一】知道居中元素的宽高](https://blog.csdn.net/weixin_41305441/article/details/89886846#_1) [absolute 负margin](https://blog.csdn.net/weixin_41305441/article/details/89886846#absolute__margin_2) [absolute margin auto](https://blog.csdn.net…

用Python写一个算24点的小程序

一、运行界面 二、显示答案——递归介绍 工作流程&#xff1a; 1. 基本情况&#xff1a;函数首先检查输入的数字列表 nums 的长度。如果列表中只剩下一个数字&#xff0c;它会判断这个数字是否接近 24&#xff08;使用 abs(nums[0] - 24) < 1e-10 来处理浮点数精度问题&…

【长安大学】苹果手机/平板自动连接认证CHD-WIFI脚本(快捷指令)

背景&#xff1a; 已经用这个脚本的记得设置Wifi时候&#xff0c;关闭“自动登录” 前几天实在忍受不了CHD-WIFI动不动就断开&#xff0c;一天要重新连接&#xff0c;点登陆好几次。试了下在网上搜有没有CHD-WIFI的自动连接WIFI自动认证脚本&#xff0c;那样我就可以解放双手&…

双击PPT文件界面灰色不可用,需要再次打开该PPT文件才能正常打开

双击PPT文件界面灰色不可用&#xff0c;需要再次打开该PPT文件才能正常打开 1. 软件环境⚙️2. 问题描述&#x1f50d;3. 解决方法&#x1f421;解决步骤 4. 结果预览&#x1f914; 1. 软件环境⚙️ Windows10 或 Windows11 专业版64位&#xff0c;安装MotionGo软件&#xff08…

蓝桥杯[每日两题] 真题:好数 神奇闹钟 (java版)

题目一&#xff1a;好数 题目描述 一个整数如果按从低位到高位的顺序&#xff0c;奇数位&#xff08;个位、百位、万位 &#xff09;上的数字是奇数&#xff0c;偶数位&#xff08;十位、千位、十万位 &#xff09;上的数字是偶数&#xff0c;我们就称之为“好数”。给定…

蓝桥杯刷题周计划(第二周)

目录 前言题目一题目代码题解分析 题目二题目代码题解分析 题目三题目代码题解分析 题目四题目代码题解分析 题目五题目代码题解分析 题目六题目代码题解分析 题目七题目代码题解分析 题目八题目题解分析 题目九题目代码题解分析 题目十题目代码题解分析 题目十一题目代码题解分…

ThinkPHP框架

在电脑C磁盘中安装composer 命令 在电脑的D盘中创建cd文件夹 切换磁盘 创建tp框架 创建一个aa的网站&#xff0c;更换路径到上一步下载的tp框架路径 在管理中修改路径 下载压缩包public和view 将前面代码中的public和view文件替换 在PHPStom 中打开文件 运行指定路径 修改demo…

Spring学习笔记:工厂模式与反射机制实现解耦

1.什么是Spring? spring是一个开源轻量级的java开发应用框架&#xff0c;可以简化企业级应用开发 轻量级 1.轻量级(对于运行环境没有额外要求) 2.代码移植性高(不需要实现额外接口) JavaEE的解决方案 Spring更像是一种解决方案&#xff0c;对于控制层&#xff0c;它有Spring…

爬虫案例八js逆向爬取网易音乐

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、js逆向的前期准备二、网站分析三、代码 前言 提示&#xff1a;这里可以添加本文要记录的大概内容&#xff1a; 爬取网易音乐 提示&#xff1a;以下是本篇…

【02】Web网页基础

一、网页的组成 1、HTML 2、CSS 3、javascript 二、网页的结构 三、节点树及节点间的关系 四、选择器 一、网页的组成 网页可以分为三大部分 —— HTML、CSS 和 JavaScript。如果把网页比作一个人的话&#xff0c;HTML 相当于骨架&#xff0c;JavaScript 相当于肌肉&#…

Dify部署踩坑指南(Windows+Mac)

组件说明 Dify踩坑及解决方案 ⚠️ 除了修改镜像版本&#xff0c;nginx端口不要直接修改docker-compose.yaml &#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01; 1、更换镜像版本 这个文件是由.env自动生成的&#xff0c;在.env配置 …

​​《从事件冒泡到处理:前端事件系统的“隐形逻辑”》

“那天在document见到你的第一眼&#xff0c;我就下定决心要陪你到天荒地老” ---React 我将从事件从出现到被处理的各个过程来介绍事件机制&#xff1a; 这张图片给我们展示了react事件的各个阶段&#xff0c;我们可以看到有DOM&#xff0c;合成事件层&#xff0c;还有…

tiktok web登录 分析

声明: 本文章中所有内容仅供学习交流使用&#xff0c;不用于其他任何目的&#xff0c;抓包内容、敏感网址、数据接口等均已做脱敏处理&#xff0c;严禁用于商业用途和非法用途&#xff0c;否则由此产生的一切后果均与作者无关&#xff01; 逆向分析 部分代码 response reques…

【音视频】ffplay常用命令

一、 ffplay常用命令 -x width&#xff1a;强制显示宽度-y height&#xff1a;强制显示高度 强制以 640*360的宽高显示 ffplay 2.mp4 -x 640 -y 360 效果如下 -fs 全屏显示 ffplay -fs 2.mp4效果如下&#xff1a; -an 禁用音频&#xff08;不播放声音&#xff09;-vn 禁…