【R包开发:入门】 简介+ 包的结构

简介

本书的目的是教你如何开发包,以便你可以写出自己的包,而不只是使用别人的包。

为什么要写一个包?

一个令人信服的理由是,你想要与他人分享代码。把你的代码打成一个包,可以方便他人使用,因为他们像你一样也知道如何使用包。如果你的代码在包中,则任何 R 用户都可以轻松地下载、安装和学习如何使用它。

【在 R 中,可分享代码的基本单位是包】

即使你从不分享你的代码,包也很有用。它主要是节省你自己的时间。”把代码组织在一个包中会让你工作起来更容易,因为包有一些通用的约定。标准化的规范带来标准化的工具

1.1 开发理念

任何可以自动化的都应该自动化。把手动工作量降到最小。目标是让你将时间用于思考你想要包做什么,而不是包结构的各种细节。

这一理念主要是通过 devtools 包+RStudio 来实现的

1.2 入门

确保你有最新版本的 R(至少是 3.1.2),获得你将要用到的包

install.packages(c("devtools", "roxygen2", "testthat", "knitr"))

H还需要一个 C 编译器和几个命令行工具

  • Windows 下,下载并安装 Rtools(RTools: Toolchains for building R and R packages from source on Windows)。注意:这不是一个 R 包!

  • 在 Mac 下,确保你有 Xcode(可在 App Store 上免费获取)或 Xcode 命令行工具(Sign In - Apple)。

  • Linux 下,确保你不仅安装了 R,而且还安装了 R 开发工具。例如,在 Ubuntu 和 Debian 上,你需要安装 Ubuntu 的 r-base-dev 包。

1.3 约定

    在本书中,foo() 指函数,bar 指变量或函数参数,baz/ 指路径,#> 是输出注释,# 是常规的注释。

包的结构

2.1 给包命名

2.1.1 命名的要求

选择一个很容易被搜索到的独特的名字。这很容易让潜在的用户找到你的包,并且容易记住的包名。

2.1.2 命名的策略

找到一个和这个问题相关的词,修改它,如:plyr,lubridate,knitr,testdat  

使用缩略词:Rcpp,lvplot 

 增加一个额外的 r:stringr,tourr, gistr 

2.2 创建一个包

第一种方法:

(1) 单击 File | New Project(文件 | 新项目)。

(2) 选择 New Directory(新的目录)

(3) 下一步,选择 R Package(R 包)

(4) 最后,给出你的包名,然后单击 Create Project(创建项目)

 第二种方法:

 R 里面通过命令来创建

devtools::create("path/to/package/pkgname")

以上两种方法创建的包都属于最小的可用包,它有三个组成部分。

(1) 一个 R/ 目录,

(2) 一个描述文件 DESCRIPTION,

(3) 一个命名空间文件 NAMESPACE,

这个包还包括一个 RStudio 项目文件 pkgname.Rproj,这将使你的包易于在 RStudio 中使用。 

如果你的包中不包含.Rproj文件, 可以使用  devtools::user_rstudio("path/to/package")  来添加它。

.Rproj 文件只是一个文本文件。不需要手动来修改这个文件。通常,可以使用友好的 Project Options(项目选项)对话框,通过 RStudio 右上角的 Projects(项目)菜单来访问

2.3 RStudio 项目

使用Rstudio的好处

  • 每个项目都是独立的,在一个项目中运行的代码不会影响任何其他项目

  • 你可以获得方便的代码导航工具,如 F2 可以跳转到函数的定义,Ctrl+. 可通过名字来查找函数。

  • 有用的快捷键,用于通用的包开发任务

2.4 什么是包

2.4.1 源码包

源码包只是包含 R/ 子目录、DESCRIPTION 等组件的一个目录。

2.4.2 压缩包

压缩包是一个已经压缩为单个文件的包,R 中的压缩包使用 .tar.gz 扩展名。这意味着多个文件已经被打包成一个文件(.tar)并用 gzip(.gz)压缩过。

如果你解压一个压缩包,会看到它和你的源码包看起来几乎一样。解压的包和源码包的主要区别如下。

  • 使用指南被创建,你可以得到 HTML 和 PDF 输出而不是 Markdown 或者 LaTex 的输入。

  • 你的源码包中可能包含开发时产生的一些临时文件,比如 src/ 目录下编译生成的中间文件,它们在解压的包中是不存在的。

  • .Rbuildignore 文件中列出的任何文件都不会出现在解压的包中。

.Rbuildignore的介绍

.Rbuildignore 防止源码包中的文件出现在压缩包中。它允许你在源码包中包含比压缩包中更多的目录。这在你从其他文件生成包的内容(比如数据)时特别有用。这些文件应该包含在源码包中,但是只有结果需要发布。这对于 CRAN 包(顶层目录的个数是固定的)来说特别重要

一个典型的 .Rbuildignore 文件

2.4.3 二进制包

二进制包是一个单独的文件。如果将它解压缩,你会看到它的内部结构和源码包大不一样

二进制包是平台相关的:不能在 Mac 上安装一个 Windows 二进制包,也不能在Windows 上安装一个Mac 二进制包

Meta/ 目录包含大量 Rds 文件:这些文件缓存了包的一些元数据,比如帮助文件包含了什么主题,以及解析出的 DESCRIPTION 文件中的版本信息。

html/ 目录包含 HTML 的帮助文件

如果包中 src/ 目录下有代码,那么现在将有一个 libs/ 目录,其中包含了编译过的 32 位(i386/)和 64 位(x64/)代码。

inst/ 目录下的内容被移到了顶层目录

2.4.4 已安装的包

已安装的包只是解压到一个包库的二进制包。在理想的情况下,安装一个包包括一系列简单的步骤:源码包→压缩包,压缩包→二进制包,二进制包→已安装的包。

支持所有包安装的工具是 R 的命令行工具 R CMD INSTALL,它可以安装源码包、压缩包和二进制包。

  • devtools 的函数封装了这个工具,devtools::install() 有效地封装了 R CMD INSTALLdevtools::build() 封装了 R CMD BUILD,可以把源码包打包成压缩包。devtools::install_github() 从 GitHub 下载源码包,运行 build() 来生成使用指南,然后使用 R CMD INSTALL 安装包。
  • install.packages() 用于下载和安装 CRAN 编译的二进制包。他的工作方式是它载源码包,编译,然后安装。

2.4.5 内存中的包

library() 和 require() 会加载和附加一个已安装的包。在写脚本的时候,加载和附加包之间的区别并不重要;但是在写包的时候,这个区别是非常重要的。

2.5 什么是库

库是一个包含已安装包的目录

你的电脑中可以有多个库。事实上,几乎每个人都至少有两个库:一个用来放已经安装的包,另一个用来放 R 安装时自带的包(如 base、stats 等)。通常情况下,用户安装包的目录在不同的 R 版本下有所不同。这就是为什么你重新安装 R 以后,以前安装的包好像都丢了,实际上它们仍然在你的硬盘上,只是 R 找不到它们而已。

使用 .libPaths() 来查看当前正在使用的库是哪个

.libPaths()

参考文献

中文书籍 (ituring.com.cn)

R Packages (2e) (r-pkgs.org)

英文书籍Writing R Extensions (r-project.org) (官方 R 扩展开发手册)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/442807.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

ASUS华硕天选2锐龙版笔记本电脑FA506ICB/FA706IC原装出厂Windows11系统,预装OEM系统恢复安装开箱状态

链接:https://pan.baidu.com/s/122iHHEOtNUu4azhVPnxNuA?pwdsqk7 提取码:sqk7 适用型号: FA506IM、FA506IE、FA506IC、FA506IHR FA506IR、FA506IHRB、FA506ICB、FA506IEB FA706IM、FA706IE、FA706IC、FA706IHR FA706IR、FA706IHRB、F…

【stm32 外部中断】

中断:在主程序运行过程中,出现了特定的中断触发条件(中断源),使得CPU暂停当前正在运行的程序,转而去处理中断程序,处理完成后又返回原来被暂停的位置继续运行 中断优先级:当有多个中…

【深度学习笔记】6_6 通过时间反向传播(back-propagation through time)

注:本文为《动手学深度学习》开源内容,部分标注了个人理解,仅为个人学习记录,无抄袭搬运意图 6.6 通过时间反向传播 在前面两节中,如果不裁剪梯度,模型将无法正常训练。为了深刻理解这一现象,本…

C#,排列组合的堆生成法(Heap’s Algorithm for generating permutations)算法与源代码

1 排列组合的堆生成法 堆生成算法用于生成n个对象的所有组合。其思想是通过选择一对要交换的元素,在不干扰其他n-2元素的情况下,从先前的组合生成每个组合。 下面是生成n个给定数的所有组合的示例。 示例: 输入:1 2 3 输出&a…

2024蓝桥杯每日一题(归并排序)

一、第一题:火柴排队 解题思路:归并排序 重点在于想清楚是对哪个数组进行归并排序求逆序对 【Python程序代码】 from math import * n int(input()) a list(map(int,input().split())) b list(map(int,input().split())) na,nb [],[] for …

#onenet网络请求http(GET,POST)

参考博文: POST: https://blog.csdn.net/qq_43350239/article/details/104361153 POST请求(用串口助手测试): POST /devices/1105985351/datapoints HTTP/1.1 api-key:AdbrV5kCRsKsRCfjboYOCVcF9FY Host:api.heclouds.com Con…

liteIDE 解决go root报错 go: cannot find GOROOT directory: c:\go

liteIDE环境配置 我使用的liteIDE为 x36 5.9.5版本 。在查看–>选项 中可以看到 LiteEnv,双击LiteEnv ,在右侧选择对应系统的env文件,我的是win64系统,所以文件名为win64.env 再双击 win64.env ,关闭当前窗口&…

专业的项目管理系统,企智汇!帮助企业提高项目管理效率!

一款专业的项目管理系统,是企智汇项目管理系统!企智汇专业做项目管理系统10年,经过10年的打磨,有成熟的项目管理系统功能,它面向各个企业的项目团队,提供数字化、智能化、信息化的项目管理功能,…

【PHP+代码审计】PHP基础——数据类型

🍬 博主介绍👨‍🎓 博主介绍:大家好,我是 hacker-routing ,很高兴认识大家~ ✨主攻领域:【渗透领域】【应急响应】 【Java、PHP】 【VulnHub靶场复现】【面试分析】 🎉点赞➕评论➕收…

STM32H750片外QSPI启动配置简要

STM32H750片外QSPI启动配置简要 📍参考信息源:《STM32H750片外Flash启动(W25Q64JVSIQ)》🔖本例程基于Keil MDk开发平台。🍁配置框架: ✨为什么使用要使用QSPI启动方式 不管对于STM32H7系列单片机,还是其他…

VGG:更小的卷积核

“paddingvalid”,表示不对输入数据进行填充(不填充)“paddingsame”,表示对输入数据进行填充,使得输出特征图的大小与输入特征图的大小相同 VGG16 网络架构 Why VGG16 VGG16 卷积层 全连接层层数 1个输出层 更小的卷积核 连续的33卷积…

换手机后日记不见了怎么恢复?换手机日记内容同步方法

曾经,我使用的是一款苹果手机,这部手机陪伴了我整整3年。随着时间的推移,手机内存不够用成为了我面临的一个大问题,因此我决定更换一部新手机——这次我选择了OPPO品牌。在更换手机的过程中,我利用手机搬家软件一键同步…

AI辅助研发对医药、汽车和电子行业的影响

目录 1、医药行业:加速药物发现与开发 2、汽车行业:创新设计与生产 3、电子行业:优化芯片设计 4、展望未来 AI辅助研发正逐渐改变我们的世界,特别是在医药、汽车和电子等关键行业中的应用,已经展现出其巨大潜力。本…

支付宝开放平台,证书验签出错,请确认charset参数放在了URL查询字符串中且各参数值使用charset参数指示的字符集编码

#小李子9479# 支付宝证书接入方式的时候出现如下错误 验签出错,请确认charset参数放在了URL查询字符串中且各参数值使用charset参数指示的字符集编码 产生的原因分析: 1。验证签名里面有中文 2。在json_encode的时候使用了JSON_UNESCAPED_UNICODE参数…

【字符串】【贪心】【 树状数组】2193. 得到回文串的最少操作次数

作者推荐 视频算法专题 本文涉及知识点 字符串 贪心 树状数组 分类讨论 LeetCode2193. 得到回文串的最少操作次数 给你一个只包含小写英文字母的字符串 s 。 每一次 操作 ,你可以选择 s 中两个 相邻 的字符,并将它们交换。 请你返回将 s 变成回文串…

mysql-DBA(2)-日志-数据库复制

1.mysqlbinlog 查看日志-精确查找-增量备份 1.1查看日志 mysqlbinlog binlog.000003 -vv --base64auto | less //两种都有 base64加密和看的懂的明文 mysqlbinlog binlog.000003 -vv --base64never | less //不显示 mysqlbinlog binlog.000003 -vv --base64decode-rows …

Flask python开发篇: 写一个简单的接口

第一步:新建flask项目 参考使用pycharm新建一个项目 打开pycharm,根据下面图中箭头顺序,新建一个flask的项目; 第二步:运行项目, 安装成功以后,会有个app.py文件,打开以后&#…

STM32CubeIDE基础学习-STM32CubeIDE软件程序下载方法

STM32CubeIDE基础学习-STM32CubeIDE软件代码下载方法 文章目录 STM32CubeIDE基础学习-STM32CubeIDE软件代码下载方法前言第1章 代码下载第2章 下载器固件更新总结 前言 编写完代码,一般都会选择在线下载程序的方式进行验证该程序是否正确,如果发现结果和…

回收站选址(CCF 201912-2)解题思路

分析 把x,y坐标拼接成一个字符串(x,y)作为Set的key,保存到Set中,遍历Set,取出坐标,然后判断上下左右四个点是否在Set中,如果在,进而判断,四个角是否在Set中,…

搜索引擎推广6种策略助你站在市场顶峰的有效方法-华媒舍

如何有效推广自己的产品或服务变得至关重要。6种引擎霸屏推广策略是帮助你站在市场顶峰的有效方法,下面将逐一介绍这些策略。 1.搜索引擎优化(SEO) 搜索引擎优化是提升网站在搜索引擎结果页(SERP)中排名的策略。通过…