【数据挖掘】实验1:R入门(内含详细R和RStudio安装教程)

实验1:R入门

一:实验目的与要求

1:根据上课PPT内容,掌握课堂知识并进行代码练习操作,提供练习过程和结果。

2:可COPY代码运行结果直接提交,如涉及到输出图等可截图。

二:实验内容

1:R语言的下载与安装

1.1:安装R语言

从清华镜像网站(The Comprehensive R Archive Network)处下载Windows版本的R语言。点击下图中的【Download R-4.3.2 for Windows】即可下载。

下载完成后出现以下文件,双击该文件进行R语言的安装。

弹出【选择语言】后,选择默认的中文(简体),点击确定。

弹出【信息】后,点击下一步。

弹出【选择安装位置】后,进行路径设置(此处使用默认路径),点击下一步。

弹出【选择组件】后,进行组件配置(此处使用默认配置),点击下一步。

弹出【启动选项】后,此处使用默认选项No,点击下一步。

弹出【选择开始菜单文件夹】后,选择程序快捷方式的放置位置(此处使用默认文件夹),点击下一步。

弹出【选择附加任务】后,选择偏好的附加快捷方式,点击下一步。

等待文件安装。

安装完成,点击结束。

 此时,可以发现桌面添加了快捷方式【R 4.3.2】。

1.2:安装RStudio

从在线教育综合平台——数据挖掘课程处下载RStudio的安装包。

下载完成后得到下图的文件【RStudio-2022.02.1】,双击进行RStudio的安装。

弹出安装向导界面后,点击下一步。

弹出【选择安装位置】后,选择安装的路径并确认磁盘空间是否足够,点击下一步。

弹出【选择开始菜单文件夹】后,填写文件夹名称,点击安装。

等待文件的安装。

安装完成后,点击完成。

如果桌面没有出现快捷方式,则需要打开安装路径,找到可运行的exe文件。此处推荐使用everything工具直接搜索RStudio。

开第一个搜索结果的路径,在子文件目录bin下找到rstudio.exe。

右键点击该exe,选择创建桌面快捷方式,弹出提示框后,点击是。

即可发现桌面上多出了该可执行文件的快捷方式。

双击运行RStudio后,可进入以下操作界面。

2:R语言的基本操作

2.1:查看R版本,并在R Console上输入简单命令


打开R,查看到第一行输出R version 4.3.2,可知R语言的版本。测试PPT中给出的赋值公式和加法计算案例。结果如下图所示。


同时,也可通过【version】命令查看R语言的版本。结果如下图所示,可以看到倒数第二行version.string的对应信息为R version 4.3.2。

2.2:在R Console上更新R


    采用方法1更新R时,输入【install.packages(“installr”)】,将出现以下结果。

选择China镜像后,即可安装程序包,安装结果如下图。

输入【library(installr)】,将出现以下结果。

输入【updateR(fast=TRUE,cran_mirror="https://mirrors.ustc.edu.cn/CRAN/")】,将出现以下结果。可以发现本地的版本已经是最新。

同时,采用方法2更新R时,输入【installr::updateR(fast=TRUE,cran_mirror="https://mirrors.ustc.edu.cn/CRAN/")】,将出现以下结果。

2.3:在RStudio上检查更新


    首先点击工具栏的【Help】。

然后点击【Check for Updates】。

软件自动弹出以下更新内容。此处表明我们的RStudio已经是最新版本,无需更新。

2.4:RStudio界面的熟悉


RStudio的整体界面如下图所示。其中左上角为代码编辑区,左下角为命令控制台/代码执行区,右上角为资源栏,右下角为其他区。

同时,勾选代码编辑区的【Source on Save】以便自动保存代码,同时查看右侧两个按钮的功能。

第二个按钮(魔术棒)的功能如下图所示。

第一个按钮(放大镜)的功能如下图所示。

2.5:当前工作路径的修改和文件读取


在console中,通过getwd()读取当前工作路径,结果如下图所示。

同时,通过setwd()写入新的工作路径,并通过getwd()检查是否设置成功,结果如下图所示。

读取不在工作路径下的csv文件,结果如下图所示。

读取在工作路径下的csv文件,结果如下图所示。

其他工作路径设置的函数如下图所示。

函数ls()的使用结果如下图所示。

函数rm()的使用结果如下图所示。

函数help(options)的使用结果如下图所示。运行后界面右下角弹出help的内容。

工作空间的操作不再演示。

2.6:R扩展包的安装、载入和更新

安装class扩展包,结果如下图所示。

同时安装class和cluster扩展包,结果如下图所示。


在R console中利用【library(class)】载入,结果如下图所示。


在R console中利用【update.packages()】载入,结果如下图所示。

在R console中利用【help(package=’class’)】查看扩展包信息,结果如下图所示。

在Package中查看扩展包的更新情况,结果如下图所示。

 在R console中利用【installed.packages()[,c('Package','Version','LibPath')]】查看已经安装的扩展包,结果如下图所示(由于扩展包的数量过多,因此此处仅展示一部分扩展包内容)。

在R console中利用
【site="https://mirrors.tuna.tsinghua.edu.cn/CRAN"】
和【install.packages("ggplot2", repos=site)】安装绘图包ggplot2,结果如下图所示。

在R console中利用【if (!require("BiocManager", quietly = TRUE))
install.packages("BiocManager")】和【BiocManager::install(version = "3.18")】安装生物信息包,结果如下图所示。

2.7:R常用操作案例尝试


【1】dir.create("C:/Users/86158/Desktop/myprojects")

【2】dir.create("C:/Users/86158/Desktop/myprojects/project1")

【3】setwd("C:/Users/86158/Desktop/myprojects/project1")

【4】getwd()

【5】options()

【6】options(digits=3)

【7】x<-runif(20)

【8】summary(x)

【9】hist(x)

【10】save.image("myfile")

3:R语言的课后练习

【1】打开帮助文档首页,并查阅其中的“Introduction to R”。

    方法1:使用命令:help.start()

方法2:点击工具栏中【Help】下的【R Help】,进入Help界面。

点击【Manuals】中的【An Introduction to R】。

查看R语言介绍的详细内容。

【2】安装vcd包。


使用命令:install.packages("vcd")

【3】列出vcd包中可用的函数和数据集。


    使用命令:help(package="vcd")

在右下角处,可以看到可使用的数据集,各个数据集由字母顺序进行排序。

【4】载入vcd包并阅读数据集Arthritis的描述。


    首先,找到Arthritis数据集所在的链接位置。

然后,得到该数据集的描述(风湿性关节炎),具体内容如下。

Arthritis Treatment Data

Description

Data from Koch & Edwards (1988) from a double-blind clinical trial investigating a new treatment for rheumatoid arthritis.

Usage

data("Arthritis")

Format

A data frame with 84 observations and 5 variables.

ID

patient ID.

Treatment

factor indicating treatment (Placebo, Treated).

Sex

factor indicating sex (Female, Male).

Age

age of patient.

Improved

ordered factor indicating treatment outcome (None, Some, Marked).

Source

Michael Friendly (2000), Visualizing Categorical Data: http://euclid.psych.yorku.ca/ftp/sas/vcd/catdata/arthrit.sas

References

G. Koch & S. Edwards (1988), Clinical efficiency trials with categorical data. In K. E. Peace (ed.), Biopharmaceutical Statistics for Drug Development, 403–451. Marcel Dekker, New York.

M. Friendly (2000), Visualizing Categorical Data. SAS Institute, Cary, NC.

Examples

Run examples

data("Arthritis")

art <- xtabs(~ Treatment + Improved, data = Arthritis, subset = Sex == "Female")

art

mosaic(art, gp = shading_Friendly)

mosaic(art, gp = shading_max)

根据上表可知,数据的格式为【患者ID、治疗方法、患者性别、患者年龄、治疗效果】。

另外,可以使用以下命令组合,获取上述内容。

命令编号

命令内容

1

install.packages("zoo")

2

library(grid)

3

library(zoo)

4

library(vcd)

5

help(Arthritis)

【5】显示数据集Arthritis的内容(直接输入一个对象的名称将列出它的内容)。

使用命令:Arthritis

输出数据共84条。

【6】运行数据集Arthritis自带的示例。

使用命令:example(Arthritis)

输出内容如下图所示。

Data处输出该数据集共包含84行数据,5列数据特性。

上面两个图输出了treatment(治疗方法)和improved(治疗效果)之间的Pearson residuals(皮尔逊残差)。关于Pearson residuals的解释如下图所示。

三:遇到的问题和解决方案


问题1:执行【updateR()】命令时,出现以下报错。

解决1:查询资料后(Rstudio > updateR() Error in file(con, "r") : 无法打开链结 此外: Warning message: In file(con, "r") : Int... - 简书),发现是镜像没有设置好,需要手动配置。只需要将执行命令变为【updateR(fast=TRUE,cran_mirror="https://mirrors.ustc.edu.cn/CRAN/")】即可。

问题2:执行【install.packages("class")】命令时,出现以下报错。

解决
2:查询资料后(R报错:WARNING: Rtools is required to build R packages, but is not currently installed._warning: rtools is required to build r packages bu-CSDN博客),需要从官网(Rtools43 for Windows)中先下载并安装RTools43。同时输入【chooseCRANmirror()】更改镜像源。

问题3:执行【source("https://bioconductor.org/biocLite.R")】命令时,出现以下报错。

解决3:通过官网(Bioconductor - Install)找到详细的安装方法,按照R为4.3版本的指示进行操作即可。即下图中原来ppt中的方法,现在已经不适用。


问题4:执行【library(vcd)】命令时,出现以下报错。

解决4:在执行上述命令前,使用命令【library(grid)】和【install.packages("zoo")】+【library(zoo)】。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/452030.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

自建GitLab代码仓库ssh访问地址为localhost修改成域名

ssh改localhost为域名 抛出问题配置过程效果展示 抛出问题 自建的GitLab&#xff0c;代码仓库ssh访问地址为localhost&#xff0c;http地址显示域名没问题&#xff0c;就很奇怪。 找了很久帖子发现这个访问地址不在/etc/gitlab/gitlab.rb的系统配置中。 还有个帖子让改/etc/gi…

游戏开发中的坑之十三 Lut贴图相关问题

1.网上下载的或者游戏截帧得到的Lut贴图贴上之后可能效果如下&#xff0c;需要在PS里垂直方向反转一下贴图。 2.相关设置&#xff1a; &#xff08;1&#xff09;取消勾选sRGB&#xff1b; &#xff08;2&#xff09;像素为1024x32或者512x16&#xff1b; &#xff08;3&#…

学习笔记-华为IPD转型2020:2,IPD的核心思想

2&#xff0c;IPD的核心思想 以客户为导向&#xff1a;应该开发什么产品&#xff1f; 应该开发哪些产品&#xff1f;华为的“基本法”规定&#xff0c;其目的是为客户服务&#xff08;Huawei&#xff0c;1998&#xff09;。然而&#xff0c;在IPD实施后&#xff0c;对这种以客…

微信小程序开发系列(三十)·小程序本地存储API·同步和异步的区别

目录 1. 同步API 1.1 getStorageSync存储API 1.2 removeStorageSync获取数据API 1.3 removeStorageSync删除 1.4 clearStorageSync清空 2. 异步API 2.1 setStorage存储API 2.2 getStorage获取数据API 2.3 removeStorage删除API 2.4 clearStorage清空 3. …

YOLOv8改进 | 图像去雾 | 利用图像去雾网络AOD-PONO-Net网络增改进图像物体检测

一、本文介绍 本文给大家带来的改进机制是利用AODNet图像去雾网络结合PONO机制实现二次增强&#xff0c;我将该网络结合YOLOv8针对图像进行去雾检测&#xff08;也适用于一些模糊场景&#xff0c;图片不清晰的检测&#xff09;&#xff0c;同时本文的内容不影响其它的模块改进…

网康科技 NS-ASG 应用安全网关 SQL注入漏洞复现(CVE-2024-2330)

0x01 产品简介 网康科技的NS-ASG应用安全网关是一款软硬件一体化的产品,集成了SSL和IPSec,旨在保障业务访问的安全性,适配所有移动终端,提供多种链路均衡和选择技术,支持多种认证方式灵活组合,以及内置短信认证、LDAP令牌、USB KEY等多达13种认证方式。 0x02 漏洞概述 …

Redis底层数据结构之String

文章目录 1. 前提回顾2. RedisObject三大数据类型简介3. SDS字符串4. SDS字符串源码分析5. 总结 1. 前提回顾 前面我们说到redis的String数据结构在底层有多种编码方式。例如我们执行下面两条语句 set k1 v1 set age 17我们查看类型&#xff0c;发现这类型都是String类型 我们…

【力扣精选算法100道】——二进制求和

LCR 002. 二进制求和 - 力扣&#xff08;LeetCode&#xff09; 目录 &#x1f388;了解题意 &#x1f388;算法分析 &#x1f6a9;cur1>0 &#x1f6a9;cur2>0 &#x1f6a9;t &#x1f388;实现代码 &#x1f388;了解题意 遵循二进制加法法则&#xff0c;如果俩…

工具篇--分布式定时任务springBoot 整合 elasticjob使用(3)

文章目录 前言一、Springboot 整合&#xff1a;1.1 引入jar&#xff1a;1.2 配置zookeeper 注册中心&#xff1a;1.3 定义job 业务类&#xff1a;1.4 job 注册到zookeeper&#xff1a;1.5 项目启动&#xff1a;1.5.1 zookeeper 注册中心实例&#xff1a;1.5.2 任务执行日志输出…

【数据挖掘】练习1:R入门

课后作业1&#xff1a;R入门 一&#xff1a;习题内容 1.要与R交互必须安装Rstudio&#xff0c;这种说法对不对&#xff1f; 不对。虽然RStudio是一个流行的R交互集成开发环境&#xff0c;但并不是与R交互的唯一方式。 与R交互可以采用以下几种方法&#xff1a; 使用R Conso…

AHU 汇编 实验六

一、实验名称&#xff1a;实验6 输入一个16进制数&#xff0c;把它转换为10进制数输出 实验目的&#xff1a; 培养汇编中设计子程序的能力 实验过程&#xff1a; 源代码&#xff1a; data segmentbuff1 db Please input a number(H):$buff2 db 30,?,30 dup(?),13,10buff3 …

社交革命的引领者:探索Facebook如何改变我们的生活方式

1.数字社交的兴起 随着互联网的普及&#xff0c;社交媒体成为我们日常生活的重要组成部分。Facebook作为其中的先驱&#xff0c;从最初的社交网络演变成了一个拥有数十亿用户的全球化平台。它不仅改变了我们与世界互动的方式&#xff0c;还深刻影响了我们的社交习惯、人际关系以…

数据结构:树和二叉树

树的概念 1.树是一种非线性的数据结构。它是由n个有限节点的集合。 2.树分为根节点和子树。根节点没有前驱节点。 3.树的子树是由一个个子树组成&#xff0c;它们可以看作一个个集合。每个集合下面又有集合。 因此&#xff0c;树是递归定义的。 树形结构中&#xff0c;子树…

搜索引擎SEO策略介绍

baidu搜索&#xff1a;如何联系八爪鱼SEO baidu搜索&#xff1a;如何联系八爪鱼SEO baidu搜索&#xff1a;如何联系八爪鱼SEO 第一、 关键词的选择策略&#xff1a; 1、门户类的网站关键词选择策略&#xff1a; 网站每个页面本身基本都包含有关键词&#xff1a;网站拥有上百…

嵌入式数据库SQlite3-进阶篇

嵌入式数据库sqlite3 - HQ 文章目录 嵌入式数据库sqlite3 - HQ[toc] 嵌入式数据库sqlite3【进阶篇】数据库准备order子句Where 子句与逻辑运算符语法实例 group by子句having子句举例 函数SQLite COUNT 函数SQLite MAX 函数SQLite MIN 函数SQLite AVG 函数SQLite SUM 函数SQLit…

Qt 使用RAW INPUT获取HID触摸屏,笔设备,鼠标的原始数据,最低受支持的客户端:Windows XP [仅限桌面应用]

在开发绘图应用程序时&#xff0c;经常会需要读取笔设备的数据&#xff0c;通过对笔数据的解析&#xff0c;来判断笔的坐标&#xff0c;粗细。如果仅仅只是读取鼠标的坐标&#xff0c;就需要人为在应用程序端去修改笔的粗细&#xff0c;并且使用体验不好&#xff0c;如果可以实…

【C++】STL(五) Stack Queue容器

5、 stack容器 5.1 简介 ① stack是一种先进后出的容器&#xff0c;它只有一个出口。 ② 栈中只有顶端的元素才可以被外界使用&#xff0c;因此栈不允许有遍历行为。 ③ 栈中进入数据称为&#xff1a;入栈 push ④ 栈中弹出数据称为&#xff1a;出栈 pop 5.2 常用接口 …

Fair Data Exchange:区块链实现的原子式公平数据交换

1. 引言 2024年斯坦福大学和a16z crypto research团队 论文 Atomic and Fair Data Exchange via Blockchain 中&#xff0c;概述了一种构建&#xff08;包含过期EIP-4844 blobs的&#xff09;fair data-markets的协议。该论文源自a16z crypto的暑期实习计划&#xff0c;与四名…

R语言tidycmprsk包分析竞争风险模型

竞争风险模型就是指在临床事件中出现和它竞争的结局事件&#xff0c;这是事件会导致原有结局的改变&#xff0c;因此叫做竞争风险模型。比如我们想观察患者肿瘤的复发情况&#xff0c;但是患者在观察期突然车祸死亡&#xff0c;或者因其他疾病死亡&#xff0c;这样我们就观察不…

KAFKA入门教程

目录 1.安装kafka 2.安装kafkamanager可视化工具 3.springboot整合kafka 1.pom导包 2.启动类和yml配置 3.代码演示 编写生产者&#xff1a; 消费者&#xff1a; 1.安装kafka 进入kafka官网下载对应版本kafka kafka官网地址&#xff1a;Apache Kafka kafka是使用Scal…