高级统计方法 第4次作业

作业评阅:

概念

2.问题

KNN分类和KNN回归都是KNN算法在不同类型数据上的应用,但它们之间存在明显的区别。

解决的问题类型不同:KNN分类适用于解决分类问题,而KNN回归则适用于解决回归问题。当响应变量是连续的,根据输入和回归函数,预测输出;当响应变量是带有一定水平的因子型变量,就可以用来将输入变量进行分类。

决策方式不同:在预测阶段,KNN做分类时,通常采用多数表决法,即根据训练集中与预测样本特征最近的K个样本,将预测为包含最多类别数的类别。而KNN做回归时,则通常采用平均法,即取最近的K个样本的输出平均值作为回归预测值。

5.问题(略)

、、、、、、

应用

9.问题(略)

(a)问题(略)

Auto = read.csv("Auto.csv", header=T, na.strings="?")

Auto = na.omit(Auto)

Auto[,9] = as.numeric(factor(Auto[,9]))

pairs(Auto)

(b)问题(略)

cor(subset(Auto, select=-name))

(c)问题(略)

lm.fit1 = lm(mpg~.-name, data=Auto)

summary(lm.fit1)

预测变量和响应变量之间有关系,通过观察p值和t值等数据可以判别是否拒绝原假设,从而判别是否有关系,可以明显的看出有关联。

weight, year, origin这些预测变量和响应变量统计上有明显关系。

mgp随着year的变化在统计意义上有显著关联。

(d)

par(mfrow=c(2,2))

plot(lm.fit1)

可以看出残差有很明显的曲线,分布并不均匀。

plot(predict(lm.fit1), rstudent(lm.fit1))

可能存在异常值,因为存在值大于3的数据。

(e)

lm.fit2 = lm(mpg~cylinders*displacement+displacement*weight,data=Auto)

summary(lm.fit2)

cylinders*displacement之间的相互作用没有统计学意义。

displacement*weight之间的相互作用有统计学意义。

(f)

预测logX的变换

lm.fit3=lm(mpg~log(weight)+sqrt(horsepower)+acceleration+I(acceleration^2),data=Auto)

summary(lm.fit2)

par(mfrow=c(2,2))

plot(lm.fit3)

plot(predict(lm.fit3), rstudent(lm.fit3))

对数变换的残差图分布更为均匀,可以看出对数优化更有效。

10.问题(略)

(a)问题(略)

install.packages('ISLR')

library(ISLR)

summary(Carseats)

attach(Carseats)

lm.fit = lm(Sales~Price+Urban+US)

summary(lm.fit)

(b)问题(略)

Price:

P值低,表明拒绝零假设,价格和销售之间存在关系。并且之间呈负相关,价格上涨销量下降。

UrbanYes:

P值0.936,很大可以拒绝零假设,说明商店的位置和销量之间没有关系。

USYes:

P值低,说明商店是否在美国和销售额有关系,并且呈正相关。

(c)问题(略)

Sales = 13.04 - 0.05 Price - 0.02 UrbanYes + 1.20 USYes

(d)

Price和USYes 可以拒绝零假设。

(e)

lm.fit2 = lm(Sales ~ Price + US)

summary(lm.fit2)

(f)

分析RES和R^2,他们对数据的拟合程度相近。

(g)

confint(lm.fit2)

(h)

plot(predict(lm.fit2), rstudent(lm.fit2))

观察到残差在-3到3之间,并没有明显的离群点。

par(mfrow=c(2,2))

plot(lm.fit2)

有高杠杆点,可以看到有远大于总体值的数据。

14.问题(略)

(a)问题(略)

set.seed(1)

x1 = runif(100)

x2 = 0.5 * x1 + rnorm(100)/10

y = 2 + 2*x1 + 0.3*x2 + rnorm(100)

(b)问题(略)

cor(x1, x2)

plot(x1, x2)

(c)问题(略)

lm.fit = lm(y~x1+x2)

summary(lm.fit)

β0=2.1305,β1=1.4396,β2=1.0097

β1,β2的标准差和p值较高,拒绝β1,β2.

(d)

lm.fit = lm(y~x1)

summary(lm.fit)

我们可以拒绝零假设,因为p值极小。

(e)

lm.fit = lm(y~x2)

summary(lm.fit)

我们可以拒绝零假设,因为p值极小。

(f)

不矛盾,x1和x2互有影响。当被单独回归时其线性关系更清楚的指示出。

(g)

x1 = c(x1, 0.1)

x2 = c(x2, 0.8)

y = c(y, 6)

lm.fit1 = lm(y~x1+x2)

summary(lm.fit1)

lm.fit2 = lm(y~x1)

summary(lm.fit2)

lm.fit3 = lm(y~x2)

summary(lm.fit3)

par(mfrow=c(2,2))

plot(lm.fit1)

par(mfrow=c(2,2))

plot(lm.fit2)

par(mfrow=c(2,2))

plot(lm.fit3)

在第一和第三个模型中,这个点变成了一个高杠杆点。

plot(predict(lm.fit1), rstudent(lm.fit1))

plot(predict(lm.fit2), rstudent(lm.fit2))

plot(predict(lm.fit3), rstudent(lm.fit3))

模型2有距截止点远的点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/407823.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

windows安装 RabbitMQ

首先打开 RabbitMQ 官网,点击 Get Started(开始) 点击 Download Installation(下载安装)。 这里提供了两种方式进行安装,我们使用第二种方法。 使用 chocolatey以管理用户身份使用官方安装程序 往下滑,第二种方法需要 Erlang 的依赖&#x…

UE蓝图 函数调用(CallFunction)节点和源码

系列文章目录 UE蓝图 Get节点和源码 UE蓝图 Set节点和源码 UE蓝图 Cast节点和源码 UE蓝图 分支(Branch)节点和源码 UE蓝图 入口(FunctionEntry)节点和源码 UE蓝图 返回结果(FunctionResult)节点和源码 UE蓝图 函数调用(CallFunction)节点和源码 文章目录 系列文章目录一、Call…

【Vuforia+Unity】AR06-空间环境识别功能(AreaTargets)

Vuforia原理:把被识别的物体转成图、立体图、柱形图,3D模型、环境模型,然后模型生成Vuforia数据库-导入Unity-参考模型位置开始摆放数字内容,然后参考模型自动隐藏-发布APP-识别生活中实物-数字内容叠加上去! 不论你是否曾有过相关经验,只要跟随本文的步骤,你就可以成功…

uni-app vue3 setup nvue中webview层级覆盖问题

核心就是这两行,🤣发现设置后不能点击了,这个玩意可能只能弹窗打开的时候动态的修改 position: static, zindex: 0onLoad(options > {loadWebview()})function loadWebview() {let pageInfo uni.getSystemInfoSync();width.value pageI…

强大到怀疑人生!AI视频生成必备的工具推荐!

刚发现的超牛逼AI视频生成:小说文案智能分镜智能识别角色和场景批量Ai绘图自动配音添加音乐一键合成视频——播放量随便破百万。地址:跳转提示 - 3MW短网址https://3mw.cn/3ed5 这个Ai漫画推文软件的优势: 1、无需本地部署,对电脑…

Visual Studio:Entity设置表之间的关联关系

1、选择表并右键-》新增-》关联 2、设置关联的表及关联关系并“确定”即可

机器学习模型的过拟合与欠拟合

机器学习模型的训练过程中,可能会出现3种情况:模型欠拟合、模型正常拟合与模型过拟合。其中模型欠拟合与模型过拟合都是不好的情况。下面将会从不同的角度介绍如何判断模型属于哪种拟合情况。 (1)欠拟合与过拟合表现方式 欠拟合…

phtread_cancel函数用于取消线程,但不是实时的

如上图所示,线程函数中没有取消点(一般是一些系统调用----man 7 pthreads查看,自定义函数是无效的),则使用pthread_cancle函数不生效。 解决方法:可以添加pthread_testcancle(); 通过pthread_join回收的…

广联达Linkworks GetAllData 信息泄露漏洞

免责声明:文章来源互联网收集整理,请勿利用文章内的相关技术从事非法测试,由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失,均由使用者本人负责,所产生的一切不良后果与文章作者无关。该…

MATLAB练习题:计算中国式排名

​讲解视频:可以在bilibili搜索《MATLAB教程新手入门篇——数学建模清风主讲》。​ MATLAB教程新手入门篇(数学建模清风主讲,适合零基础同学观看)_哔哩哔哩_bilibili 下表给出了两种不同的排名结果,成绩越高排名越靠前…

基于Springboot的校园求职招聘系统(有报告)。Javaee项目,springboot项目。

演示视频: 基于Springboot的校园求职招聘系统(有报告)。Javaee项目,springboot项目。 项目介绍: 采用M(model)V(view)C(controller)三层体系结构…

剪辑视频调色怎么让画质变得清晰 视频剪辑调色技巧有哪些方面 剪辑视频免费的软件有哪些 会声会影调色在哪里 会声会影模板素材

视频调色的作用有很多,除了进行风格化剪辑以外,还可以让作品的画质变得清晰。通过调色来增强画面的清晰度,在观感上也会显得十分自然。视频调色的技巧有很多,并且原理大都十分简单。有关剪辑视频调色怎么让画质变得清晰&#xff0…

神经网络系列---感知机(Neuron)

文章目录 感知机(Neuron)感知机(Neuron)的决策函数可以表示为:感知机(Neuron)的学习算法主要包括以下步骤:感知机可以实现逻辑运算中的AND、OR、NOT和异或(XOR)运算。 感知机(Neuron) 感知机(Neuron)是一种简单而有效的二分类算法,用于将输入…

MATLAB环境下基于NLEO的算法的脑电EEG信号自发活动瞬态检测

自发脑电信号是一种非平稳性很强的随机信号。在传统的脑电信号处理中,较公认的处理方法大多是建立在假设脑电图是准平稳信号的基础上,即认为它可以分成若干段,每一段的过程基本平稳,但段上叠加着瞬态。瞬态信号是有别于背景节率&a…

leetcode:491.递增子序列

1.误区:不能直接对数组排序再求解子集,因为那样就改变了原有数组的顺序 2.树形结构:一个一个取数,然后保证是递增序列,且不能重复。(数层上不可以重复取,树枝上可以重复取)收集的结…

使用PM2实现高效的应用监控与管理

微信搜索“好朋友乐平”关注公众号。 1. pm2 PM2 是一个流行的进程管理器,用于 Node.js 应用程序。它支持应用程序的负载均衡、自动重启、日志管理、监控以及多环境管理等功能。PM2让开发者能够以守护进程的方式运行和管理 Node.js 应用,即使在应用崩溃…

This dependency was not found解决方法

问题如上(前端代码),我是引用js文件出的问题,无法找到api/userManage模块。 解决:没感觉哪有问题,把后面加了个/,就解决了,代表src目录,应该是目录和目录之间应该有/作为分割:

计算机网络-局域网

文章目录 局域网局域网拓扑结构以太网以太网传输介质以太网时隙提高传统以太网带宽的途径以太网帧格式 局域网协议IEEE 802参考模型IEEE802.2协议LLC帧格式及其控制字段LLC提供的三种服务 IEEE 802.3协议IEEE 802.4协议IEEE 802.5协议 高速局域网100M以太网千兆以太网万兆以太网…

数理统计的基本概念

文章目录 前提概念性质常用的统计量 前提概念 与概率论的区别,他是基于实际数据的,但是概率是理论计算的结果。 总体:与所研究问题相关的对象的全体。 样本:按照一定的规定(每个个体被抽中的概率相同)&…

C/C++暴力/枚举/穷举题目(刷蓝桥杯基础题的进!)

目录 前言 一、百钱买百鸡 二、百元兑钞 三、门牌号码(蓝桥杯真题) 四、相乘(蓝桥杯真题) 五、卡片拼数字(蓝桥杯真题) 六、货物摆放(蓝桥杯真题) 七、最短路径(蓝…