实验七 综合实验

一.

下载并成功运行Anaconda,jupyter book ,spyder

输入检验(print (“hello”))

二.

在jupyter prompt中安装库:

  1. 找到anaconda 的Scripts库,并复制路径以备后面安装命令

D:\Program Files\anaconda3\Scripts

  1. 进入prompt命令界面输入pip:

①第一个pip命令

检查pip是否成功

②第二个pip命令

③第三、四个pip命令

三.输入代码,依次运行

1.

import io, os, sys, types, time, datetime, math, random

import requests, subprocess,io, tempfile

2.

#导入第三方库

# 数据处理

import numpy as np

import pandas as pd

# 数据可视化

import matplotlib.pyplot as plt

import missingno

import seaborn as sns

from pandas.plotting import scatter_matrix

from mpl_toolkits.mplot3d import Axes3D

# 特征选择和编码

from sklearn.feature_selection import RFE, RFECV

from sklearn.svm import SVR

from sklearn.decomposition import PCA

from sklearn.preprocessing import OneHotEncoder, LabelEncoder, label_binarize

# 机器学习

import sklearn.ensemble as ske

from sklearn import datasets, model_selection, tree, preprocessing, metrics

from sklearn import linear_model

from sklearn.svm import LinearSVC

from sklearn.ensemble import RandomForestClassifier,GradientBoostingClassifier

from sklearn.neighbors import KNeighborsClassifier

from sklearn.naive_bayes import GaussianNB

from sklearn.linear_model import LinearRegression, LogisticRegression, Ridge, Lasso, SGDClassifier

from sklearn.tree import DecisionTreeClassifier

import xgboost as xgb

import lightgbm as lgb

# 网格搜索、随机搜索

import scipy.stats as st

from scipy.stats import randint as sp_randint

from sklearn.model_selection import GridSearchCV

from sklearn.model_selection import RandomizedSearchCV

# 模型度量(分类)

from sklearn.metrics import precision_recall_fscore_support, roc_curve, auc

# 警告处理

import warnings

warnings.filterwarnings('ignore')

# 在 Jupyter 上画图

%matplotlib inline

3.

# 字段名

headers = ['age', 'workclass', 'fnlwgt',

           'education', 'education-num',

           'marital-status', 'occupation',

           'relationship', 'race', 'sex',

           ' capital-gain', 'capital-loss',

           'hours-per-week', 'native-country',

           'predclass']

# 加载训练集

# 读数据时 如何处理缺失值

training_raw = pd.read_csv('C://Users//Administrator//Desktop//adult.data',

                           header=None,

                           names=headers,

                           sep=',\s',

                           na_values=["?"],

                           engine='python')

# 加载测试集

test_raw = pd.read_csv('C://Users//Administrator//Desktop//adult.test',

                       header=None,

                       names=headers,

                       sep=',\s',

                       na_values=["?"],

                       engine='python',

                       skiprows=1)

test_raw.shape # : (16281, 15),数据的维度# 训练集和测试集加到一起做分析

dataset_raw = training_raw._append(test_raw) # 合并数据集# 为了避免索引引起的不必要错误,对索引进行处理

dataset_raw.reset_index(inplace=True) # 还原索引为数据

dataset_raw.drop('index', inplace=True, axis=1) # 删除还原的索引

#查看 DataFrame 占用内存

def convert_size(size_bytes):

    if size_bytes == 0:

        return "0B"

    size_name = ("Bytes", "KB", "MB", "GB", "TB", "PB", "EB", "ZB","YB")

    i = int(math.floor(math.log(size_bytes, 1024))) # 获取占用内存的级别(向下取整)

    p = math.pow(1024, i)

    s = round(size_bytes / p, 2) # 获取占用内存的大小,四舍五入,保留两位小数

    # 返回数据对应的内存空间的大小。

    # memory_usage:返回 DataFrame 中每个 series 对应的内存大小。

    # sum:求和

    return "%s %s" % (s, size_name[i])

convert_size(dataset_raw.memory_usage().sum())

  • 运行结果

五、

dataset_raw.describe()

data

set_raw.describe(include=['O'])

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/435816.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

网络原理初识

一、IP地址 概念 IP 地址主要用于标识网络主机、其他网络设备(如路由器)的网络地址。简单说, IP 地址用于定位主机 的网络地址 。 就像我们发送快递一样,需要知道对方的收货地址,快递员才能将包裹送到目的地。 二、…

搭建的svn 1.14.1,拉取代码时候没输入账户密码就报错 auth failed

这边在ubuntu里面搭的svn server,但是拉代码的是否一直报错 auth faield,一开始以为是有auth cache,去设置里面清楚了,windows 里面也清楚了,但是还是报错 问题原因 一直排查才发现,我新增用户的时候&…

vue+uniapp实现图形验证码功能-插件(附源码)

一、需求背景 vueuniapp实现图形验证码功能-插件(附源码) 在登录系统时,除了密码登录,还需要提供验证码登录。 涉及验证码,为了安全,一般会加入图形验证码,然后再发短信验证码。 如图&#xff1…

为国产信创服务器提供LDAP统一身份认证方案

金融信创作为 8 大行业信创之首,早已成为其他行业信创建设的参考。金融行业有着极为复杂的业务场景,对系统有着极高的稳定可靠需求,因此,在寻找微软 AD 国产化替代方案时,常会涉及到更深层次的场景。例如,最…

计算机大数据毕业设计-基于Flask的旅游推荐可视化系统的设计与实现

基于Flask的旅游推荐可视化系统的设计与实现 编程语言:Python3.10 涉及技术:FlaskMySQL8.0Echarts 开发工具:PyCharm 摘要:以Pycharm为旅游推荐系统开发工具,采用B/S结构,使用Python语言开发旅游景点推…

电网数字孪生的开发框架

电网数字孪生的开发框架通常会综合利用多种技术和工具,包括数据处理、模型建立、仿真与优化等方面的工具和平台。以下是一些常用的开发框架,希望对大家有所帮助。北京木奇移动技术有限公司,专业的软件外包开发公司,欢迎交流合作。…

网络安全: Kali Linux 进行 SSH 渗透与防御

目录 一、实验 1.环境 2.nmap扫描目标主机 3.Kali Linux 进行 SSH 渗透 3.Kali Linux 进行 SSH 防御 二、问题 1.SSH有哪些安全配置 一、实验 1.环境 (1)主机 表1 主机 系统版本IP备注Kali Linux2022.4 192.168.204.154(动态&…

【JavaScript 漫游】【031】window 对象总结

文章简介 本篇文章为【JavaScript 漫游】专栏的第 030 篇文章,记录了浏览器模型中 window 对象的相关知识点。 window 对象概述 浏览器里面,window 对象(注意,w 为小写)指当前的浏览器窗口。它也是当前页面的顶层对…

Java中线程操作的相关方法

当涉及到在Java中操作线程时,有许多内置的类和方法可供使用。下面是关于Java中线程操作的主要方法和技术的简要教程: 1. 创建线程 在Java中,有两种主要的方式来创建线程: - 继承 Thread 类并重写其 run() 方法。 - 实现 Runna…

深入探讨javascript的流程控制与分支结构,以及js的函数

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 所属的专栏:前端泛海 景天的主页:景天科技苑 文章目录 1.流程控制与分支结构1.if分支结构2.switch case 分支结构3.循环结…

C++消息队列处理提高性能的方法

1 消息队列特点 在当前多数软件系统中,处理传递消息多用消息队列机制,他具有以下优点: 1. 异步通信:消息队列支持异步通信,发送者和接收者之间的解耦程度较高。发送者将消息放入队列后即可继续执行,而不需要等待接收者的响应。这样可以提高系统的吞吐量和处理能力。 2.…

删除指定的数

删除指定的数 题目描述:解法思路:解法代码:运行结果: 题目描述: 先输入10个整数存放在数组中,再输入⼀个整数n,删除数组中所有等于n的数字,数组中剩余的数组保证数组的最前面&#…

电脑键盘快捷键,掌握这些,快速提高效率!

“我是一名电脑新手,在使用电脑时还有很多不懂的。想问问大家平常有什么比较好用的电脑键盘快捷键可以推荐吗?” 在数字化时代,电脑已成为我们生活与工作中不可或缺的工具。掌握一些常用的电脑键盘快捷键,不仅能提高我们的工作效率…

[备赛笔记]——5G大唐杯(5G考试等级考考试基础试题)

个人名片: 🦁作者简介:学生 🐯个人主页:妄北y 🐧个人QQ:2061314755 🐻个人邮箱:2061314755qq.com 🦉个人WeChat:Vir2021GKBS 🐼本文由…

学生信息管理展示-h5版(uniapp+springboot+vue)

记录一下做的第一个完整的h5业务。 一、登录 二、个人中心 三、首页(管理员) 四、首页(学生) 五、视频展示 学生信息管理展示(h5)完整版

如何解决由于浏览器版本升级导致脚本用不了的问题【文章底部可得就业内推码】

目录 1. 使用WebDriverManager: 2. 手动下载更新驱动: 3. 设置浏览器选项: 4. 使用Selenium Grid: 5. 参考官方文档和社区: 面对浏览器版本升级导致的网页自动化脚本无法正常运行的问题,你可以采取以下…

chromedriverUnable to obtain driver for chrome using ,selenium找不到chromedriver

1、下载chromedriver chromedriver下载网址:CNPM Binaries Mirror 老版本在:chromedriver/ 较新版本在:chrome-for-testing/ 2、设置了环境变量还是找不到chromedriverUnable to obtain driver for chrome using NoSuchDriverException:…

Java基础及开发环境配置教程

Java基础 Java是一种广泛使用的编程语言,以其“一次编写,到处运行”的能力而闻名。无论是开发桌面应用程序、Web应用程序还是移动应用程序,Java都是一个优秀的选择。本文将介绍Java的基础知识和如何配置Java开发环境。 1. Java简介 Java是…

【CSP试题回顾】201609-2-火车购票

CSP-201609-2-火车购票 解题思路 初始化座位: 首先,它创建了一个20行5列的二维向量 seatMap 用于表示车厢的座位情况。每个座位按顺序赋予了一个编号,从1到100。这部分代码通过两层循环完成,外层循环遍历所有的排,内层循环遍历每…

【学习】torch.nn.CrossEntropyLoss交叉熵损失函数

交叉熵损失函数torch.nn.CrossEntropyLoss 交叉熵主要是用来判定实际的输出与期望的输出的接近程度,为什么这么说呢,举个例子: 在做分类的训练的时候,如果一个样本属于第K类,那么这个类别所对应的输出节点的输出值应…