【Linux取经路】探寻shell的实现原理

在这里插入图片描述

文章目录

  • 一、打印命令行提示符
  • 二、读取键盘输入的指令
  • 三、指令切割
  • 四、普通命令的执行
  • 五、内建指令执行
    • 5.1 cd指令
    • 5.2 export指令
    • 5.3 echo指令
  • 六、结语

一、打印命令行提示符

const char* getusername() // 获取用户名
{
    return getenv("USER");
}

const char* gethostname() // 获取主机名
{
    return getenv("HOSTNAME");
}

const char* getpwd() // 获取当前所处的目录
{
    char* pos = strrchr(getenv("PWD"), '/'); // 查找最后一个 ‘/’ 
    if(*(pos+1) != '\0') return pos+1; // 说明不是根目录,返回最后一个文件夹
    return pos;
}

void tooltip() // 打印命令行提示框
{
    printf(LEFT "%s@%s %s" RIGHT PROMPT" ", getusername(), gethostname(), getpwd());
}

在这里插入图片描述
代码分析:获取基础信息本质上是通过调用 getenv 接口来获取对应环境变量的值。借助 strrchr 函数来查找当前路径中的最后一个文件分隔符 /,它有可能是文件分隔符也有可能是根目录因此要单独判断。

二、读取键盘输入的指令

char command[1024]; // 存储键盘输入的指令

int getcommand(char* command, int size) // 读取指令
{
    memset(command, '\0', size);
    char* ret = fgets(command, size, stdin); // 这里 ret 一定不为空,因为至少会输入一个回车,fgets 可以读取回车
    assert(ret != NULL);
    (void)ret;// “假装使用一下ret,防止有些编译器警告”
    // aaabc\n\0
    command[strlen(command)-1] = '\0'; // 去掉结尾的 \n
    return 1;
}

int interact(char* command, int size) // 交互
{
    tooltip();
    while(getcommand(command, size) && (strlen(command) == 0))
    {
        tooltip();
    }
}

int main()
{
    interact(command, sizeof(command)); // 交互
    printf("echo: %s\n", command);
    return 0;
}

在这里插入图片描述
代码分析:键盘输入的指令本质上就是一串字符串,这里不能用 scanf 来获取字符串,因为 scanf 是不会读取空格和回车的(遇到空格和回车就停止读取),而我们一般的指令都是带选项的,指令和选项之间一般会用空格隔开,用 scanf 会导致我们指令读不全。这里使用 fgets 函数来读取键盘输入,其第一参数是存储指令的空间的首地址;第二个参数是空间的大小;第三个参数是从哪个文件流中读取,一个 C/C++ 程序默认会打开三个文件流 stdinstdoutstderr,这里选择从 stdin 中读取,也就是从标准输入中读取。gets 函数会在结尾自动帮我们添加 \0,并且当读取的字符个数大于存储容量时,该函数会自动在结尾放 \0,因此我们可以不用考虑为 \0 预留空间或者认为的在字符串结尾加 \0。其次该函数读取成功返回 command 的首地址,否则返回 NULL,在当前场景下,除非读取错误,否则至少都会读入一个 \n,一般我们输入完指令就是敲回车,什么指令不输也敲回车,因此正常情况下 ret 不可能为 NULL。这里还要考虑删除掉读取到的 \n,因为我们不需要它,我们只要完整的指令。

三、指令切割

#define SEPARATOR " " // 指令分隔符
char* argv[ARGC_LONG] = {NULL}; // 存储指令和选项的起始地址

void commandcut(char* command, char** argv, int argvsize) // 指令切割
{
    memset(argv, 0, argvsize); // 清空
    char cop_command[COMMAND_LONG] = {'\0'}; // 保证 command 串不被改变
    for(int i = 0; command[i] != '\0'; i++)
    {
        cop_command[i] = command[i];
    }
    // 开始切割子串
    char* ret = strtok(cop_command, SEPARATOR);
    int i = 0;
    while(ret != NULL)
    {
        argv[i++] = ret;
        ret = strtok(NULL, " ");
    }
}

int main()
{
    while(1)
    {
        // 1、交互获取命令行参数
        interact(command, sizeof(command)); // 交互

        // 到这里说明指令已经获取到了,接下来将指令打散
        // 2、指令切割
        commandcut(command, argv, sizeof(argv));
        for(int i = 0; argv[i]; i++)
        {
            printf("[%d]: %s\n", i, argv[i]);
        }
        printf("echo: %s\n", command);
    }
    return 0;
}

在这里插入图片描述

代码分析:这一步主要是借助 strtok 函数将获取到的指令切割成一个一个的子串,将所有子串的起始地址存储在 argv 里面。注意 strtok 函数会改变原空间的内容,因此创建了一段临时的空间 cop_command

四、普通命令的执行

void normalcommandexecution(char** _argv, int* _lastcode) // 普通命令的执行
{
    pid_t id = fork();
    if(id < 0)
    {
        perror("fork");
    }
    else if(id == 0)
    {
        // child
        int ret = execvp(_argv[0], _argv);
        if(ret == -1)
        {
            perror("exeecp");
            exit(EXIT_CODE);
        }
    }
    else
    {
        // father
        int status;
        pid_t ret = waitpid(id, &status, 0); // 阻塞等待
        if(ret == id)
        {
            *_lastcode = WEXITSTATUS(status);
        }
    }
}

int main()
{
    while(1)
    {
        // 1、交互获取命令行参数
        interact(command, sizeof(command)); // 交互

        // 到这里说明指令已经获取到了,接下来将指令打散
        // 2、指令切割
        commandcut(command, argv, sizeof(argv));
        
        // 3、普通命令执行
        normalcommandexecution(argv, &lastcode);
    }
    return 0;
}

在这里插入图片描述
代码分析:对于 ls 这种普通指令(非内建指令),先通过 fork 创建子进程,然后再调用 execvp 接口进行程序替换,去执行输入的指令。

五、内建指令执行

5.1 cd指令

bool isnormalcommand(char **_argv) // 指令判断
{
    if (strcmp(_argv[0], "cd") == 0)
        return false;

    return true;
}

void changpwd(char** _argv) // 更改当前工作目录
{
    chdir(_argv[1]); // 更改当前工作目录
    // getpwd(pwd, sizeof(pwd));
    sprintf(getenv("PWD"), "%s", getcwd(pwd, sizeof(pwd))); // 修改环境变量
}

void builtincommand(char **_argv) // 内建命令执行
{
    if (strcmp(_argv[0], "cd") == 0)
    {
        changpwd(_argv);
    }
}

int main()
{
    while (1)
    {
        // 1、交互获取命令行参数
        interact(command, sizeof(command)); // 交互

        // 到这里说明指令已经获取到了,接下来将指令打散
        // 2、指令切割
        commandcut(command, argv, sizeof(argv));

        // 3、指令判断

        // 3、普通命令执行
        if (isnormalcommand(argv)) // 普通指令
            normalcommandexecution(argv, &lastcode);
        else // 内建指令
            builtincommand(argv);
    }
    return 0;
}

在这里插入图片描述

代码分析:要考虑内建指令,那在指令切割之后要先对指令进行判断。内建指令不需要创建子进程去执行,而是直接由当前的 bash 进程去执行。比如说 cd 指令,执行完 cd 指令后,我们要让当前的 bash 更改工作目录,而不是让其创建子进程去执行 cd 指令,那样改变的就是子进程的工作目录。可以发现,一个指令执行完后,如果会对 bash 产生影响,那么它就必须是内建指令。其次关于 cd 指令,它改变了当前的工作目录,这一点该如何理解呢?我 myshell 就是一个可执行程序,我的源代码和编译得到的可执行文件始终都放在 /home/wcy/linux-s/2023-10-28a/myshell 目录下,你 cd 命令凭什么能改变我的工作目录?其实并不然,这里改变工作目录是:一个可执行程序在变成进程产生 PCB 对象后,PCB 里面维护了一个属性就叫做当前可执行程序的工作目录,cd 指令改变的其实就是这一属性,并不是改变 myshell 程序的存储位置,我们通过调用 chdir 系统调用来修改这一属性。最后,因为我们前面是通过环境变量来获取当前工作目录,而环境变量在被当前 myshell 进程从父进程继承下来后是不会自动发生改变的,因此在执行完 cd 指令后,我们要对 PWD 环境变量进行修改,环境变量本质上就是存储在内存中的一段字符串信息,因此我们可以采用 sprintf 函数对该字符串信息进行修改。

在这里插入图片描述

5.2 export指令

#define USER_ENV_SIZE 100  // 允许用户添加的环境变量个数
#define USER_ENV_LONG 1024 // 用户一个环境变量的最大长度

char userenv[USER_ENV_SIZE][USER_ENV_LONG]; // 保存用户添加的环境变量
int userenvnum = 0;                         // 当前用户输入的环境变量个数

void exportcommand(char** _argv, char(*_userenv)[USER_ENV_LONG], int* _userenvnum)
{
    // 将用户输入的环境变量存储起来
    strcpy(_userenv[*_userenvnum], _argv[1]);
    int ret = putenv(_userenv[(*_userenvnum)++]);
    if (ret == 0)
        perror("putenv");
}

在这里插入图片描述
代码分析:只要 bash 不退出,我们每次添加的环境变量都应该被保存起来,我们输入的环境变量是被当做指令保存在 command 里面,当下一次输入指令,上一次输入的内容就会被清空。putenv 添加环境变量,并不是把对应的字符串拷贝到系统的表当中,而是把该字符串的地址保存在系统的表中,因此我们要确保保存环境变量字符串的那个地址里的环境变量不会被修改,所以我们需要为用户输入的环境变量,也就是那一串字符串单独开辟一块空间进行存储,保证在内次重新输入指令的时候,不会影响到之前用户添加的环境变量。因为环境变量本质就是一个字符串,所以这里我们定义了一个字符二维数组来存储用户输入的环境变量,先把用户输入的环境变量存入我们定义的这个数组,然后再调用 putenv 函数将数组中的内容添加到当前的环境变量。这样就可以保证只要当前 bash 不退出,用户历史上添加的环境变量都在。这里涉及到二维数组传参的问题,再来回顾一下,数组名表示首元素地址,二维数组的首元素是一个一维数组,所以函数形参的类型是一个字符一维数组的地址,也就是 char(*)[USER_ENV_LONG]

5.3 echo指令

void echocommand(char **_argv, int _argc)
{
    if (_argv[1][0] == '$')
    {
        char *ptr = _argv[1] + 1;
        printf("%s\n", getenv(ptr));
    }
    else
    {
        int i = 1;
        while (i < _argc)
        {
            char *ret = strtok(_argv[i], "\"");
            while (ret != NULL)
            {
                printf("%s", ret);
                ret = strtok(NULL, "\"");
            }
            printf("%c", ' ');
            i++;
        }
        printf("\n");
    }
}

在这里插入图片描述
代码分析echo 指令需要考虑将输入的 " 去掉,其次可能连续输入多个字符串,还要考虑 echo$ 配合使用是去打印环境变量的值。

小结:当我们登陆的时候,系统就是要启动一个 shell 进程,我们 shell 本身的环境变量是在用户登录的时候,shell 会读取用户目录下的 .bash_profile 文件,里面保存了导入环境变量的方式。

在这里插入图片描述
在这里插入图片描述

六、结语

今天的分享到这里就结束啦!如果觉得文章还不错的话,可以三连支持一下,春人的主页还有很多有趣的文章,欢迎小伙伴们前去点评,您的支持就是春人前进的动力!

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/376022.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Multisim14.0仿真(五十五)汽车转向灯设计

一、功能描述&#xff1a; 左转向&#xff1a;左侧指示灯循环依次闪亮&#xff1b; 右转向&#xff1a;右侧指示灯循环依次闪亮&#xff1b; 刹车&#xff1a; 所有灯常亮&#xff1b; 正常&#xff1a; 所有灯熄灭。 二、主要芯片&#xff1a; 74LS161D 74LS04D 74…

运维必会篇-日志(错误日志,二进制日志,查询日志,慢查询日志)

日志 错误日志 错误日志是 MySQL 中最重要的日志之一&#xff0c;它记录了当 mysqld 启动和停止时&#xff0c;以及服务器在运行过 程中发生任何严重错误时的相关信息。当数据库出现任何故障导致无法正常使用时&#xff0c;建议首先查看此日 志。 该日志是默认开启的&#x…

LINUX基础培训二十四之shell字符串处理

一、shell字符串 字符串&#xff08;String&#xff09;就是一系列字符的组合。字符串是 Shell 编程中最常用的数据类型之一&#xff08;除了数字和字符串&#xff0c;也没有其他类型了&#xff09;。字符串可以由单引号 包围&#xff0c;也可以由双引号" "包围&…

laravel distinct查询问题,laravel子查询写法

直接调用后&#xff0c;count查询会和实际查询的数据对不上&#xff0c;count还是查询全部数据&#xff0c;而实际的列表是去重的。 给distinct加上参数&#xff0c;比如去重的值的id&#xff0c;就加id。 另一种写法是使用group by id 子查询。 sql语句&#xff1a; selec…

echarts使用之折线图(二)

1.基本使用 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><meta http-equiv"X-UA-Compatible" cont…

CSS综合案例4

CSS综合案例4 1. 综合案例 我们来做一个静态的轮播图。 2. 分析思路 首先需要加载一张背景图进去需要4个小圆点&#xff0c;设置样式&#xff0c;并用定位和平移调整位置添加两个箭头&#xff0c;也是需要用定位和位移进行调整位置 3. 代码演示 html文件 <!DOCTYPE htm…

服务器被黑,安装Linux RootKit木马

前言 疫情还没有结束&#xff0c;放假只能猫家里继续分析和研究最新的攻击技术和样本了&#xff0c;正好前段时间群里有人说服务器被黑&#xff0c;然后扔了个样本在群里&#xff0c;今天咱就拿这个样本开刀&#xff0c;给大家研究一下这个样本究竟是个啥&#xff0c;顺便也给…

mmdetection使用自己的voc数据集训练模型实战

一.自己数据集整理 将labelimg格式数据集进行整理 1.1. 更换图片后缀为jpg import os import shutilroot_path/media/ai-developer/imgfileos.listdir(root_path)for img in file:if img.endswith(jpeg) or img.endswith(JPG) or img.endswith(png):img_pathos.path.join(root…

python实现飞书群机器人消息通知(消息卡片)

python实现飞书群机器人消息通知 直接上代码 """ 飞书群机器人发送通知 """ import time import urllib3 import datetimeurllib3.disable_warnings()class FlybookRobotAlert():def __init__(self):self.webhook webhook_urlself.headers {…

vue electron应用调exe程序

描述 用Python写了一个本地服务编译成exe程序&#xff0c;在electron程序启动后&#xff0c;自动执行exe程序 实现 1. 使用node的child_process模块可以执行windows执行&#xff0c;通过指令调exe程序 // electron/index.js var cp require("child_process"); /…

1080p 显示屏分辨率玩游戏的大有人在

喜欢玩游戏的其实大可不必为不能把自己的主机升级到4060焦虑&#xff0c;也不必望着最新的显卡天梯图眼馋兴叹。根据 Steam 平台的调查&#xff0c;六成 Steam 玩家仍然还在用 1080p 显示屏分辨率玩游戏。 根据Steam硬件调查4月份的榜单&#xff0c;1920x1080分辨率依然占据了6…

利用LLM大模型生成sql的深入应用探究

Chat2DB 是一款有开源免费的多数据库客户端工具,和传统的数据库客户端软件Navicat、DBeaver 相比 Chat2DB 集成了 AIGC 的能力&#xff0c;能够将自然语言转换为 SQL&#xff0c;也可以将 SQL 转换为自然语言&#xff0c;可以给出研发人员 SQL 的优化建议&#xff0c;极大地提升…

【C语言】GtkStack及标签页的关闭

一、GtkStack GtkStack 是 GTK&#xff08;GIMP Toolkit&#xff09;库中的一个容器类&#xff0c;用于管理多个子窗口部件&#xff08;widgets&#xff09;&#xff0c;但在任何给定时间内只显示其中一个。GtkStack 提供了一种在同一个空间位置显示不同内容的方式&#xff0c…

I.MX6u嵌入式linux驱动开发

1&#xff1a;Ubuntu 系统入门 当 Ubuntu 系统入门以后&#xff0c;我们重点要学的就是如何在 Linux 下进行 C 语言开发&#xff0c;如何使 用 gcc 编译器、如何编写 Makefile 文件等等 首先安装虚拟机软件VM&#xff1a; Vmware Workstation 软件可以在 Wmeare …

Vue3.0

一、Vue3.0介绍 1、Vue3.0介绍 在学习Vue3.0之前&#xff0c;先来看一下与Vue2.x的区别 会从如下几点来介绍 源码组织方式的变化Composition API性能提升Vite Vue3.0全部使用TypeScript进行重写&#xff0c;但是90%的API还是兼容2.x,这里增加了Composition API也就是组合A…

电动汽车雷达技术概述 —— FMCW干扰问题(第二篇)

此图片来源于网络 1、雷达干扰问题 此图表示道路上的典型场景。 两辆支持雷达的汽车相互通过。 在过去&#xff0c;这是不太可能的事件。 然而&#xff0c;随着越来越多的77千兆赫雷达汽车 在道路中行驶&#xff0c;这种事件发生的可能性变得越来越高。 因此&#xff0c;一个…

华为数通方向HCIP-DataCom H12-821题库(单选题:441-460)

第441题 下面是一台路由输出的信息,关于这段信息描述正确的是 <R1>display bgp peerBGP local router ID : 2.2.2.2Local AS number : 100Total number of peers : 2 Peers in established state : 0Peer V AS MsgRcvd MsgSent OutQ Up/Down …

【JavaScript】Js中一些数组常用API总结

目录 前言 会改变原数组 push() pop()和shift() unshift() splice() sort() reverse() 不会改变原数组 slice() concat() filter() forEach() toString join(分隔符&#xff09; 小结 前言 Js中数组是一个重要的数据结构&#xff0c;它相比于字符串有更多的方法…

Android7.0-Fiddler证书问题

一、将Fiddler的证书导出到电脑&#xff0c;点击Tools -> Options -> HTTPS -> Actions -> Export Root Certificate to Desktop 二、下载Window版openssl&#xff0c; 点击这里打开页面&#xff0c;下拉到下面&#xff0c;选择最上面的64位EXE点击下载安装即可 安…

node cool-admin 后端宝塔面板看代码日志

1.需求 我在处理回调问题的时候 就是找不到问题&#xff0c;因为不像本地的代码 控制台能够直接打印出来问题&#xff0c;你是放在线上了 所以那个日志不好打印 我看网上都说是 直接用一个loger.js 打印 日志 放到代码文件里 这种方法也许有用 但是对我这框架cool来说 试了没有…