C语言常见概念
- 前言
- 1. C语言是什么
- 2. C语言的历史和辉煌
- 3. 编译器的选择VS2022
- 3.1 编译和链接
- 3.2 编译器的对比
- 3.3 VS2022的优缺点
- 优点:
- 缺点:
- 4. VS项目和源文件、头文件介绍
- 5. 第⼀个C语言程序
- 6. main函数
- 7. printf和库函数
- 8. 关键字介绍
- 9. 字符和ASCII编码
- 10. 字符串和\0
- 11. 转义字符
- 12. 语句和语句分类
- 12.1 空语句
- 12.2 表达式语句
- 12.3 函数调用语句
- 12.4 复合语句
- 12.5 控制语句
- 13. 注释是什么?为什么写注释?
- 13.1 注释的2种形式
- 13.1.1 /* */的形式
- 13.1.2 // 的形式
- 13.2 注释会被替换
前言
本文基于VS2022,将介绍一系列的C语言常见概念,让读者对C语言有一个初步的了解,并对后续的学习做下铺垫。
具体代码可以下载资源
C语言是一种通用的、过程式的计算机编程语言,支持结构化编程、词汇变量作用域和递归等功能,其设计提供了低级别的存取权限,并且要求程序员管理所有的内存细节。C语言的基本构成包括数据类型(如整型、浮点型、字符型等)、运算符(如算术运算符、关系运算符、逻辑运算符等)、控制结构(如顺序结构、选择结构、循环结构等)以及函数等。此外,C语言还提供了指针的概念,这是其他许多编程语言所不具备的。指针是一个变量,其值为另一个变量的地址,通过指针可以间接访问和操作内存中的数据。C语言也支持数组、结构体、联合体等复合数据类型,以及文件操作、动态内存分配等高级功能。C语言在操作系统、编译器、硬件驱动等领域有广泛应用,同时也是学习其他编程语言如C++、Java等的基础。
1. C语言是什么
人和人交流使用的是自然语言,如:汉语、英语、日语,那人和计算机是怎么交流的呢?使用计算机语言。
目前已知已经有上千种计算机语言,人们是通过计算机语言书写的程序,给计算机下达指令,让计算机工作的。
C语言就是众多计算机语言中的一种,当然C++/Java/Go/Python都是计算机语言。
2. C语言的历史和辉煌
C语言最初是作为Unix系统的开发工具而发明的。
3. 编译器的选择VS2022
3.1 编译和链接
C语言是一门编译型计算机语言,C语言源代码都是文本文件,文本文件本身无法执行,必须通过编译器翻译和链接器的链接,生成二进制的可执行文件,可执行文件才能执行。
C语言代码是放在 .c 为后缀的文件中的,要得到最终运行的可执⾏程序,中间要经过编译和链接2个过程。
c语言代码展示:
一个工程一般都会有多个源文件组成,如下图所示,演示了源程序经过编译器和链接器处理的过程。
- 每个源文件(.c)单独经过编译器处理生成对应的目标文件(.obj为后缀的文件)
- 多个目标文件和库文件经过链接器处理生成对应的可执行程序(.exe文件)
这就是,在Windows电脑上C语言程序生成的exe可执行文件
3.2 编译器的对比
C语言是一门编译型的计算机语言,需要依赖编译器将计算机语言转换成机器能够执行的机器指令。
那我们常见的C语言编译器都有哪些呢?
比如:msvc、clang、gcc就是⼀些常见的编译器,当然也有⼀些集成开发环境如:VS2022、XCode、CodeBlocks、DevC++、Clion等。
集成开发环境(IDE)用于提供程序开发环境的应用程序,一般包括代码编辑器、编译器、调试器和图形用户界面等⼯具。集成了代码编写功能、分析功能、编译功能、调试功能等⼀体化的开发软件服务套。
vscode 严格意义上来说不是集成开发环境,应该是文本编译器,可以按照一个比较强的记事本来理解。
- VS2022集成了MSVC(安装报包较大一些,安装简单,无需多余配置,使用起来非常方便)
- XCode集成了clang(苹果电脑上的开发工具)
- CodeBlocks集成了gcc(这个工具比较小众,需要配置环境,不太推荐)
- DevC++集成了gcc(⼩巧,但是工具过于简单,对于代码风格的养成不好,⼀些竞赛使用)
- Clion是默认使⽤CMake,编译器是可以配置的(工具是收费,所以暂时推荐大家使用)
VS2022安装方法,可以点开这个链接,了解一下VS2022的安装方法
3.3 VS2022的优缺点
优点:
- VS2022是⼀个主流的集成开发环境
- VS2022包含了:编辑器+编译器+调试器,功能强大
- 直接安装即可使用,基本不用额外配置环境,上手容易
- 默认界面是中文的,初学者友好
缺点:
- 功能丰富,安装包大,占用空间多。
4. VS项目和源文件、头文件介绍
在VS上写代码,我们是需要创建项目的,直接新建项目就可以了。
在项目中就可以添加源文件和头文件。
C语⾔把 .c 为后缀的文件称为源文件,把 .h 为后缀的文件称为头文件。
5. 第⼀个C语言程序
#include <stdio.h>
#include <stdlib.h>
int main()
{
printf("Hello C\n");
system("pasue");
return 0;
}
6. main函数
每个C语言程序不管有多少行代码,都是从 main 函数开始执行的, main 函数是程序的入口,main 函数也被叫做:主函数。 main 前面的 int 表示 main 函数执行结束的时候返回一个整型类型的值。所以在 main 函数的最后写 return 0; 正好前后呼应。
- main函数是程序的入口
- main函数有且仅有⼀个
- 即使⼀个项目中有多个.c文件,但是只能有⼀个main函数(因为程序的入口只能有一个)第一次写代码,⼀些常见的错误总结:
- main被写成了mian
- main后边的()漏掉了
- 代码中不能使用中文符号,比如括号和分号
- 一条语句结束后,有分号
main函数的位置可以在任意位置,但是如果在主函数之中调用了哪些函数,必须在main函数前对其所调用函数进行声明或包含其被调用函数的头文件。 main函数不一定非要在头文件的后面
VS2022 注释选中行:ctrl+k+c 取消注释:ctrl+k+u
argc:参数计数器,整型变量 ,表示参数的个数.
argv:参数数组本身,指向字符串的指针数组,表示存放参数的具体内容.
【注意】:argv[0]保存自身运行的目录路径和程序名,从argv[1]开始才是指向对应的参数
故main函数一般写为:
int main (int argc,char *argv[]){…}
int main (int argc,char **argv){…}
envp 指的是环境变量
7. printf和库函数
在上面的代码中有一句代码如下:
printf("Hello C\n");
代码中使用了 printf 函数,实现了在屏幕上的信息的打印。
这里简单的介绍⼀下 printf ,printf 是一个库函数,它的功能是在标准输出设备(一般指屏幕)上进行信息的打印。上面的代码是使用 printf 函数打印字符串。只要把想要打印的一串字符放在双引号中并传递给printf函数就可以打印。
printf函数也可以用来打印其他类型的数据,比如:
int n = 100;
printf("%d\n", n); //printf打印整型
printf("%c\n", 'q'); //printf打印字符
printf("%lf\n", 3.14); //printf打印双精度浮点型
这⾥的 %d , %c 等是占位符,指的是在输出的时候会被后边的值替换。
库函数的时候,是需要包含头文件的,比如: printf 函数需要包含的就是 stdio.h 这个头⽂件,
具体的方法就是:
#include <stdio.h>
当然我们也可以使用
#include "stdio.h"
具体区别在后续文章
先简单的提一下,尖括号和引号最大的区别是,使用引号可以导入你写的源文件,比如你写了一个text.c 你想在test.c里使用text.c里的函数,就可以使用#include "text.c"
那什么是库函数呢?
为了不再重复实现常见的代码,让程序员提升开发效率,C语言标准规定了一组函数,这些函数再由不同的编译器厂商根据标准进行实现,提供给程序员使用。这些函数组成了⼀个函数库,被称为标准库,这些函数也被称为库函数。在这个基础上一些编译器厂商可能会额外扩展提供部分函数(这些函数其他编译器不⼀定支持)。
⼀个系列的库函数一般会声明在同一个头文件中,所以库函数的使用,要包含对应的头文件。
8. 关键字介绍
C语⾔中有⼀批保留的名字的符号,比如: int 、 if 、 return ,这些符号被称为保留字或者关键字。
- 关键字都有特殊的意义,是保留给C语言使用的
- 程序员自己在创建标识符的时候是不能和关键字重复的
- 关键字也是不能自己创建的。
C语言的32个关键字如下:
在C99标准中加⼊了 inline 、 restrict 、 _Bool 、 _Comploex 、 _Imaginary 等关键字。
9. 字符和ASCII编码
在键盘上可以敲出各种字符,如:a,q,@,#等,这些符号都被称为字符,C语言中字符是用单引号括起来的,如:‘a’,‘b’,‘@’。
我们知道在计算机中所有的数据都是以二进制的形式存储的,那这些字符在内存中分别以什么样的二进制存储的呢?如果我们每个⼈自己给这些字符中的每个字符编一个二进制序列,这个叫做编码,为了方便大家相互通信,不造成混乱,后来美国国家标准学会(ANSI)出台了⼀个标准ASCII编码,C语言中的字符就遵循了ASCII编码的⽅式。
我们不需要记住所有的ASCII码表中的数字,在有需要的时候使用时查看就可以,不过我们最好能掌握几组特殊的数据:
- 字符A ~ Z的ASCII码值从65 ~ 90
- 字符a ~ z的ASCII码值从97 ~ 122
- 对应的大小写字符(a和A)的ASCII码值的差值是32
- 数字字符0 ~ 9的ASCII码值从48 ~ 57
- 换行 \n 的ASCII值是:10
- 在这些字符中ASCII码值从0 ~ 31这32个字符是不可打印字符,无法打印在屏幕上观察
小写字母的ASCII码值-32就能得到对应的大写字母的ASCII码值
小写字母的ASCII码值比对应的大写字母的ASCII码值更大的。
单个字符的打印可以使⽤%c来指定格式:
#include <stdio.h>
int main()
{
printf("%c\n", 'Q');
printf("%c\n", 81); //这⾥的81是字符Q的ASCII码值,也是可以正常打印的
return 0;
}
可打印字符展⽰:
#include <stdio.h>
int main()
{
int i = 0;
for (i = 32; i <= 127; i++)
{
printf("%c ", i);
if (i % 16 == 15)
printf("\n");
}
return 0;
}
10. 字符串和\0
C语言中如何表示字符串呢?使用双引号括起来的一串字符就被称为字符串,如:“abcdef”,就是⼀个字符串。
字符串的打印格式可以使用 %s 来指定,也可以直接打印如下:
#include <stdio.h>
int main()
{
printf("%s\n", "hello C");
printf("hello c");
return 0;
}
C语言字符串中⼀个特殊的知识,就是在字符串的末尾隐藏放着⼀个 \0 字符,这个 \0 字符是字符串的结束标志。
VS2022的监视窗口观察字符串
对于字符串"abcdef",我们实际上看到了6个字符:a,b,c,d,e,f,但是实际上在末尾还隐藏⼀个 \0 的
转义字符, \0 是字符串的结束标志。所以我们在使用库函数 printf() 打印字符串或者strlen() 计算字符串长度的时候,遇到 \0 的时候就自动停止了。
C语言中也可以把⼀个字符串放在⼀个字符数组中,我们在这里利用下面的代码验证⼀下 \0 的功能。
#include <stdio.h>
int main()
{
char arr1[] = {'a', 'b', 'c'}; //arr1数组中存放3个字符
char arr2[] = "abc"; //arr2数组中存放字符串
printf("%s\n", arr1);
printf("%s\n", arr2);
return 0;
}
这样的代码,我调试的时候,观察⼀下 arr1 和 arr2 的内容:
运行结果:
我们可以看到, arr1 字符数组在打印的时候,打印了 a 、 b 、 c 后还打印了⼀些随机值,这就是
因为 arr1 在末尾的地方没有 \0 字符作为结束标志,在打印的时候没有停止。
但是 arr2 的打印就是完全正常的,就是因为 arr2 数组是使用字符串常量初始化的,数组中有 \0
作为技术标志,打印可以正常停止。
如果我们在arr1数组中单独放⼀个’\0’字符会怎么样呢?
#include <stdio.h>
int main()
{
char arr1[] = {'a', 'b', 'c', '\0'};
char arr2[] = "abc";
printf("%s\n", arr1);
printf("%s\n", arr2);
printf("%s\n", "abc\0def");
return 0;
}
看到三次打印的结果是一样的了,都是打印到 \0 的时候就停止了,那从上述的例子我们确实能够观察到 \0 的作用和重要性的。
11. 转义字符
也许在前面的代码中你看到 \n , \0 很纳闷时啥。其实在字符中有⼀组特殊的字符是转义字符,转义字符顾名思义:转变原来的意思的字符。
比如:我们有字符 n ,在字符串中打印的时候自然能打印出这个字符,如下:
#include <stdio.h>
int main()
{
printf("abcndef");
return 0;
}
输出的结果:
如果我们修改⼀下代码,在 n 的前面加上 \ ,变成如下代码:
#include <stdio.h>
int main()
{
printf("abc\ndef");
return 0;
}
输出的结果:
我们可以看到修改的前后代码输出的结果,截然不同的,那这是为什么呢?
这就是转义字符的问题, \n 是⼀个转义字符表示换行的意思,我们可以简单的理解为 \ 让 n 的意思发生了转变, n 本来是⼀个普通的字符,被 \ 转义为换行的意思。
C语言中像这样的转义字符还有⼀些,具体如下:
- \? :在书写连续多个问号时使用,防止他们被解析成三字母词,在新的编译器上没法验证了。
- \’ :用于表示字符常量’
- \" :用于表示⼀个字符串内部的双引号
- \\ :用于表示⼀个反斜杠,防止它被解释为⼀个转义序列符。
- \a :警报,这会使得终端发出警报声或出现闪烁,或者两者同时发生。
- \b :退格键,光标回退⼀个字符,但不删除字符。(我们可以使用这个来进行覆盖,如:打印abc ,在b后放个\b 光标到b前面 所以结果是ac)
关于退格符不同系统还是不一样的,比如在VS2013上,只是单纯的退格,但是在VS2022上是直接退格并删除的
- \f :换页符,光标移到下一页。在现代系统上,这已经反映不出来了,行为改成类似于 \v 。
- \n :换行符。
- \r :回车符,光标移到同⼀行的开头。
- \t :制表符,光标移到下⼀个水平制表位,通常是下⼀个8的倍数。
- \v :垂直分隔符,光标移到下⼀个垂直制表位,通常是下⼀行的同⼀列。
下面2种转义字符可以理解为:字符的8进制或者16进制表示形式
- \ddd :ddd表示1 ~ 3个⼋进制的数字。 如: \130 表示字符X
- \xdd :dd表示2个⼗六进制数字。 如: \x30 表示字符0
- \0 :null字符,代表没有内容, \0 就是 \ddd 这类转义字符的⼀种,用于字符串的结束标志,其ASCII码值是0。
#include <stdio.h>
int main()
{
printf("%c\n", '\'');//引号会默认与第一个引号匹配,如果是'''则会报错,这时候就需要转义字符了
printf("%s\n", "\"");
printf("c:\\test\\code\\test.c\n");
printf("\a");
printf("%c\n", '\130'); //130是8进制,转换成10进制是88,以88作为ASCII码值的字符是
printf("%c\n", '\x30'); //x30中的30是16进制,转换成10进制是48,以48作为ASCII码值的
return 0;
}
这些ASCII码值是可以自己写代码验证的,大家也可以自己验证。
关于转义字符我们首先要了解,然后要能在字符串中识别出来。
例题:
int main()
{
//strlen是求字符串长度的函数- 统计的是字符串中\0之前的字符的个数,不包含\0
//string.h
printf("%zd\n", strlen("abc"));//abc\0 3
printf("%zd\n", strlen("c:\test\130\test.c"));//? 13
return 0;
}
\t \130 \t 都是一个字符,不能按照正常的来数个数 %zd 是打印 size_t 类型的数字 size_t 就是无符号数,具体可看第二篇C语言数据类型和变量 1.5.1 sizeof操作符 的关于size_t的解释
12. 语句和语句分类
C语言的代码是由⼀条⼀条的语句构成的,C语言中的语句可为以下五类:
- 空语句
- 表达式语句
- 函数调用语句
- 复合语句
- 控制语句
12.1 空语句
空语句是最简单的,⼀个分号就是⼀条语句,是空语句。
#include <stdio.h>
int main()
{
; //空语句
return 0;
}
空语句,⼀般出现的地方是:这里需要⼀条语句,但是这个语句不需要做任何事,就可以写⼀个空语句。
12.2 表达式语句
表达式语句就是在表达式的后边加上分号。如下所⽰:
#include <stdio.h>
int main()
{
;//空语句无意义
int a = 20;
int b = 0;
b = a + 5; //表达式语句
return 0;
}
12.3 函数调用语句
函数调用的时候,也会加上分号,就是函数调用语句。
#include <stdio.h>
int Add(int x, int y)
{
return x+y;
}
int main()
{
printf("hehe\n"); //函数调⽤语句
int ret = Add(2, 3); //函数调⽤语句
return 0;
}
12.4 复合语句
复合语句其实就是前面讲过的代码块,成对括号中的代码就构成⼀个代码块,也被称为复合语句。
#include <stdio.h>
void print(int arr[], int sz) //函数的⼤括号中的代码也构成复合语句
{
int i = 0;
for(i=0; i<sz; i++)
{
printf("%d ", arr[i]);
}
}
int main()
{
int i = 0;
int arr[10] = {0};
for(i=0; i<10; i++) //for循环的循环体的⼤括号中的就是复合语句
{
arr[i] = 10-i;
printf("%d\n", arr[i]);
}
return 0;
}
12.5 控制语句
控制语句用于控制程序的执行流程,以实现程序的各种结构方式(C语⾔支持三种结构:顺序结构、选择结构、循环结构),它们由特定的语句定义符组成,C语言有九种控制语句。
可分成以下三类:
- 条件判断语句也叫分支语句:if语句、switch语句;
- 循环执行语句:do while语句、while语句、for语句;
- 转向语句:break语句、goto语句、continue语句、return语句。
13. 注释是什么?为什么写注释?
注释是对代码的说明,编译器会忽略注释,也就是说,注释对实际代码没有影响。
注释是给程序员自己,或者其他程序员看的。
好的注释可以帮我们更好的理解代码,但是也不要过度注释,不要写没必要的注释。
当然不写注释可能会让后期阅读代码的⼈抓狂。
写注释⼀定程度上反应了程序作者的素质,建议⼤家写必要的注释。
13.1 注释的2种形式
C语言的注释有两种表示方法。
13.1.1 /* */的形式
第⼀种方法是将注释放在 /* … */ 之间,内部可以分行。
/* 注释 */
/*
这是⼀⾏注释
*/
这种注释可以插在行内。
int fopen(char* s /* file name */ , int mode);
上面示例中, /* file name */ 用来对函数参数进行说明,跟在它后面的代码依然会有效执行。
这种注释⼀定不能忘记写结束符号 */ ,否则很容易导致错误。
printf("a "); /* 注释⼀
printf("b ");
printf("c "); /* 注释⼆ */
printf("d ");
上面示例的原意是,第⼀行和第三行代码的尾部,有两个注释。
但是,第⼀行注释忘记写结束符号,导致注释⼀延续到第三行结束。
/* */
的这个注释也不支持嵌套注释, /* 开始注释后,遇到第⼀个 */ 就认为注释结束了。
/*
printf("a ");
printf("b ");
printf("c "); /* 注释⼆ */
printf("d ");
*/
一般把/* * / 称为C语言风格注释,但是有缺点,不支持嵌套注释
13.1.2 // 的形式
第⼆种写法是将注释放在双斜杠 // 后面,从双斜杠到⾏尾都属于注释。这种注释只能是单行,可以放在行首,也可以放在一行语句的结尾。这是C99标准新增的语法。
// 这是⼀⾏注释
int x = 1; // 这也是注释
不管是哪⼀种注释,都不能放在双引号里面。
双引号里面的注释符号,会成为字符串的⼀部分,解释为普通符号,失去注释作⽤。
printf("// hello /* world */ ");
上面示例中,双引号里面的注释符号,都会被视为普通字符,没有注释作用。
13.2 注释会被替换
编译时,注释会被替换成⼀个空格,所以 min/* 这里是注释*/Value 会变成 min Value ,而不是 minValue 。
int main()
{
int a/* hehe*/ b;//像这样就会报错,注释会被替换成空格
return 0;
}