R语言6种将字符转成数字的方法,写在新年来临之际

咱们临床研究中,拿到数据后首先要对数据进行清洗,把数据变成咱们想要的格式,才能进行下一步分析,其中数据中的字符转成数字是个重要的内容,因为字符中常含有特殊符号,不利于分析,转成数字后才能更好进行分析。
今天来总结一下常见的几种字符转数字的方法,建议收藏,以后需要用时找得到。咱们先生成一个数据,来示例一下。

library(tidyr)

# 创建原始宽格式的数据框
data <- data.frame(
  id = c(1:8),
  group = c(0, 0, 0, 0, 1, 1, 1, 1),
  w0 = c(0.35, 0.77, 0.48, 0.63, 0.45, 0.56, 1.08, 0.55),
  w1 = c(1.01, 1.32, 1.18, 1.42, 0.59, 0.86, 1.44, 1.20),
  w2 = c(1.47, 1.60, 1.65, 1.88, 0.64, 1.37, 1.93, 1.68),
  w4 = c(2.46, 2.54, 2.86, 3.13, 0.99, 2.04, 2.63, 2.87)
)

# 将数据框从宽格式转换为长格式
df_long <- data %>%
  pivot_longer(
    cols = c('w0', 'w1', 'w2', 'w4'), # 需要转换的列名
    names_to = "time",                # 新生成的列名,用来存储原列名
    values_to = "value"               # 新生成的列名,用来存储原数值
  )

在这里插入图片描述
好的,数据生成了,我们看到到time这一列的变量是w0,w1,w2,w4的字符变量,咱们想要把它转成数字0,1,2,4,应该怎么转换呢?最常见的时候是想起ifelse()函数来一个个的转换,但是这样效率太低了,介绍几种快速转换的。

  1. dplyr包
library(dplyr)
df_long2 <- df_long %>%
  mutate(time = case_when(
    time == "w0" ~ 0,
    time == "w1" ~ 1,
    time == "w2" ~ 2,
    time == "w4" ~ 4,
    TRUE ~ as.numeric(time) # 这一行确保如果未来有其他值,它们不会变成NA
  ))

在这里插入图片描述
这样就轻松转换好了。

  1. 也是继续使用dplyr包recode()函数,咱们注意一下,这两个函数的判断方法有点不一样。等号前面不能有空格。
library(dplyr)
df_long3 <- df_long %>%
  mutate(time = recode(time, w0 =0, w1 =1, w2 =2, w4 =4))

在这里插入图片描述
3. 使用基础R中的 factor() 和 as.numeric(),这个的好处是不用在额外使用R包,但是你必须一个个的指定。也要对基础语法比较掌握。

df_long3$time2 <- as.numeric(as.character(factor(df_long$time, 
                                               levels = c("w0", "w1", "w2", "w4"),
                                               labels = c(0, 1, 2, 4))))

在这里插入图片描述

  1. stringr包来对数字提取,因为咱们是字符后面的数字部分,所以可以用这样的方法,并不适合所有情况。
library(stringr)
df_long4 <- df_long %>%
  mutate(time = as.numeric(str_extract(time, "\\d+")))

在这里插入图片描述

  1. 使用dplyr包的if_else函数,注意一下这个和基础的ifelse()函数是不一样的
df_long5<- df_long %>%
  mutate(time = if_else(time == "w0", 0,
                        if_else(time == "w1", 1,
                                if_else(time == "w2", 2,
                                        if_else(time == "w4", 4, NA_real_)))))

在这里插入图片描述
6. 因为它是位置索引,所以索引回来的是位置,因此有个小缺点,4变成了3,不能完全满意。为什么我还要说呢,使用 match() 函数,这个函数主要是用来索引字符匹配的。明白它的用法在很多地方都能有很大的用途。

df_long6 <- df_long %>%
  mutate(time = match(time, c("w0", "w1", "w2", "w4")) - 1) # 因为索引从1开始,所以减去1

在这里插入图片描述

写在新年来临之际,公众号4年来有无数的铁粉默默支持,给我提了很多好的意见,受益良多,在此默默感谢。
新的一年公众号会将对纵向分析进行一些介绍,包括混合效应模型、gee模型、gamm模型等。也会继续复现一些关于charls的纵向分析文章。
感谢大家对我的scitable包的支持,有些粉丝还不明白它能做什么,最基础的功能就是:基线表、单因素和多因素分析,多模型分析,阈值效应分析,亚组分析,rcs分析。还可以进行数据挖掘和交互效应深层次数据挖掘。
目前还有很多功能待写,比如一键相加交互模型函数、gamm模型函数、gam模型的阈值函数、gee模型的曲线拟合和阈值函数,新版的亚组森林图,相信不会让你们失望的。

最后祝各位粉丝新年快乐,合家美满,连发连中。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/947225.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C语言面的向对象编程(OOP)

如果使用过C、C#、Java语言&#xff0c;一定知道面向对象编程&#xff0c;这些语言对面向对象编程的支持是语言级别的。C语言在语言级别不支持面向对象&#xff0c;那可以实现面向对象吗&#xff1f;其实面向对象是一种思想&#xff0c;而不是一种语言&#xff0c;很多初学者很…

C++ 基础思维导图(一)

目录 1、C基础 IO流 namespace 引用、const inline、函数参数 重载 2、类和对象 类举例 3、 内存管理 new/delete 对象内存分布 内存泄漏 4、继承 继承权限 继承中的构造与析构 菱形继承 1、C基础 IO流 #include <iostream> #include <iomanip> //…

聊聊前端框架中的process.env,env的来源及优先级(next.js、vue-cli、vite)

在平时开发中&#xff0c;常常使用vue、react相关脚手架创建项目&#xff0c;在项目根目录可以创建.env、.env.[mode]&#xff08;mode为development、production、test)、.env.local等文件&#xff0c;然后在项目中就可以通过process.env来访问相关的环境变量了。 下面针对如下…

基于云架构Web端的工业MES系统:赋能制造业数字化变革

基于云架构Web端的工业MES系统:赋能制造业数字化变革 在当今数字化浪潮席卷全球的背景下,制造业作为国家经济发展的重要支柱产业,正面临着前所未有的机遇与挑战。市场需求的快速变化、客户个性化定制要求的日益提高以及全球竞争的愈发激烈,都促使制造企业必须寻求更加高效、智…

LeetCode算法题——螺旋矩阵ll

题目描述 给你一个正整数n&#xff0c;生成一个包含1到n2所有元素&#xff0c;且元素按顺时针顺序螺旋排列的n x n正方形矩阵matrix 。 示例 输入&#xff1a;n 3 输出&#xff1a;[[1,2,3],[8,9,4],[7,6,5]]题解 思路&#xff1a; 将整个过程分解为逐圈填充的过程&#xf…

MySQL 01 02 章——数据库概述与MySQL安装篇

一、数据库概述 &#xff08;1&#xff09;为什么要使用数据库 数据库可以实现持久化&#xff0c;什么是持久化&#xff1a;数据持久化意味着将内存中的数据保存到硬盘上加以“固化”持久化的主要作用是&#xff1a;将内存中的数据存储在关系型数据库中&#xff0c;当然也可以…

GPU 进阶笔记(四):NVIDIA GH200 芯片、服务器及集群组网

大家读完觉得有意义记得关注和点赞&#xff01;&#xff01;&#xff01; 1 传统原厂 GPU 服务器&#xff1a;Intel/AMD x86 CPU NVIDIA GPU2 新一代原厂 GPU 服务器&#xff1a;NVIDIA CPU NVIDIA GPU 2.1 CPU 芯片&#xff1a;Grace (ARM)2.2 GPU 芯片&#xff1a;Hopper/B…

vite6+vue3+ts+prettier+eslint9配置前端项目(后台管理系统、移动端H5项目通用配置)

很多小伙伴苦于无法搭建一个规范的前端项目&#xff0c;导致后续开发不规范&#xff0c;今天给大家带来一个基于Vite6TypeScriptVue3ESlint9Prettier的搭建教程。 目录 一、基础配置1、初始化项目2、代码质量风格的统一2.1、配置prettier2.2、配置eslint2.3、配置typescript 3、…

ESLint+Prettier的配置

ESLintPrettier的配置 安装插件 ​​​​​​ 在settings.json中写下配置 {// tab自动转换标签"emmet.triggerExpansionOnTab": true,"workbench.colorTheme": "Default Dark","editor.tabSize": 2,"editor.fontSize": …

Cyber Security 101-Web Hacking-JavaScript Essentials(JavaScript 基础)

任务1&#xff1a;介绍 JavaScript &#xff08;JS&#xff09; 是一种流行的脚本语言&#xff0c;它允许 Web 开发人员向包含 HTML 和 CSS&#xff08;样式&#xff09;的网站添加交互式功能。创建 HTML 元素后&#xff0c;您可以通过 JS 添加交互性&#xff0c;例如验证、on…

《机器学习》从入门到实战——逻辑回归

目录 一、简介 二、逻辑回归的原理 1、线性回归部分 2、逻辑函数&#xff08;Sigmoid函数&#xff09; 3、分类决策 4、转换为概率的形式使用似然函数求解 5、对数似然函数 ​编辑 6、转换为梯度下降任务 三、逻辑回归拓展知识 1、数据标准化 &#xff08;1&#xf…

JDK8源码分析Jdk动态代理底层原理

本文侧重分析JDK8中jdk动态代理的源码&#xff0c;若是想看JDK17源码分析可以看我的这一篇文章 JDK17源码分析Jdk动态代理底层原理-CSDN博客 两者之间有着略微的差别&#xff0c;JDK17在JDK8上改进了不少 目录 源码分析 过程 生成的代理类大致结构 本文侧重分析JDK8中jdk…

ZYNQ初识6(zynq_7010)clock时钟IP核

基于板子的PL端无时钟晶振&#xff0c;需要从PS端借用clock1&#xff08;50M&#xff09;晶振 接下去是自定义clock的IP核封装&#xff0c;为后续的simulation可以正常仿真波形&#xff0c;需要注意顶层文件的设置&#xff0c;需要将自定义的IP核对应的.v文件设置为顶层文件&a…

深度学习模型格式转换:pytorch2onnx(包含自定义操作符)

将PyTorch模型转换为ONNX&#xff08;Open Neural Network Exchange&#xff09;格式是实现模型跨平台部署和优化推理性能的一种常见方法。PyTorch 提供了多种方式来完成这一转换&#xff0c;以下是几种主要的方法&#xff1a; 一、静态模型转换 使用 torch.onnx.export() t…

GPU 进阶笔记(一):高性能 GPU 服务器硬件拓扑与集群组网

记录一些平时接触到的 GPU 知识。由于是笔记而非教程&#xff0c;因此内容不求连贯&#xff0c;有基础的同学可作查漏补缺之用 1 术语与基础 1.1 PCIe 交换芯片1.2 NVLink 定义演进&#xff1a;1/2/3/4 代监控1.3 NVSwitch1.4 NVLink Switch1.5 HBM (High Bandwidth Memory) 由…

在Unity中用Ab包加载资源(简单好抄)

第一步创建一个Editor文件夹 第二步编写BuildAb&#xff08;这个脚本一点要放在Editor中因为这是一个编辑器脚本&#xff0c;放在其他地方可能会报错&#xff09; using System.IO; using UnityEditor; using UnityEngine;public class BuildAb : MonoBehaviour {// 在Unity编…

【贪心算法】贪心算法七

贪心算法七 1.整数替换2.俄罗斯套娃信封问题3.可被三整除的最大和4.距离相等的条形码5.重构字符串 点赞&#x1f44d;&#x1f44d;收藏&#x1f31f;&#x1f31f;关注&#x1f496;&#x1f496; 你的支持是对我最大的鼓励&#xff0c;我们一起努力吧!&#x1f603;&#x1f…

(五)人工智能进阶:基础概念解释

前面我们介绍了人工智能是如何成为一个强大函数。接下来&#xff0c;搞清损失函数、优化方法和正则化等核心概念&#xff0c;才能真正驾驭它&#xff01; 1. 什么是网络模型&#xff1f; 网络模型就像是一个精密的流水线工厂&#xff0c;由多个车间&#xff08;层&#xff0…

SpringMVC(二)原理

目录 一、配置Maven&#xff08;为了提升速度&#xff09; 二、流程&&原理 SpringMVC中心控制器 完整流程&#xff1a; 一、配置Maven&#xff08;为了提升速度&#xff09; 在SpringMVC&#xff08;一&#xff09;配置-CSDN博客的配置中&#xff0c;导入Maven会非…

2、redis的持久化

redis的持久化 在redist当中&#xff0c;高可用的技术包括持久化&#xff0c;主从复制&#xff0c;哨兵模式&#xff0c;集群。 持久化是最简单的高可用的方法&#xff0c;作用就是备份数据。即将数据保存到硬盘&#xff0c;防止进程退出导致数据丢失。 redis持久化方式&…