C语言-指针及变量的概念与使用

1、指针的概念

计算机中所有的数据都必须放在内存中，不同类型的数据占用的字节数不一样，例如 int 占用 4 个字节，char 占用 1 个字节。为了正确地访问这些数据，必须为每个字节都编上号码，就像门牌号、身份证号一样，每个字节的编号是唯一的，根据编号可以准确地找到某个字节。

下图是 4G 内存中每个字节的编号（以十六进制表示）：

我们将内存中字节的编号称为地址（Address）或指针（Pointer）。地址从 0 开始依次增加，对于 32 位环境，程序能够使用的内存为 4GB，最小的地址为 0，最大的地址为 0XFFFFFFFF。

下面的代码演示了如何输出一个地址：

1. #include <stdio.h>
2.
3. int main(){
4. int a = 100;
5. char str[20] = "c.biancheng.net";
6. printf("%#X, %#X\\n", &a, str);
7. return 0;
8. }

运行结果： 0X28FF3C, 0X28FF10

%#X 表示以十六进制形式输出，并附带前缀 0X。a 是一个变量，用来存放整数，需要在前面加&来获得它的地址；str 本身就表示字符串的首地址，不需要加&。

C 语言中有一个控制符%p，专门用来以十六进制形式输出地址，不过 %p 的输出格式并不统一，有的编译器带 0x前缀，有的不带，所以此处我们并没有采用。

一切都是地址

C 语言用变量来存储数据，用函数来定义一段可以重复使用的代码，它们最终都要放到内存中才能供 CPU 使用。数据和代码都以二进制的形式存储在内存中，计算机无法从格式上区分某块内存到底存储的是数据还是代码。当程序被加载到内存后，操作系统会给不同的内存块指定不同的权限，拥有读取和执行权限的内存块就是代码，而拥有读取和写入权限（也可能只有读取权限）的内存块就是数据。 CPU 只能通过地址来取得内存中的代码和数据，程序在执行过程中会告知 CPU 要执行的代码以及要读写的数据的地址。如果程序不小心出错，或者开发者有意为之，在 CPU 要写入数据时给它一个代码区域的地址，就会发生内存访问错误。这种内存访问错误会被硬件和操作系统拦截，强制程序崩溃，程序员没有挽救的机会。 CPU 访问内存时需要的是地址，而不是变量名和函数名！变量名和函数名只是地址的一种助记符，当源文件被编译和链接成可执行程序后，它们都会被替换成地址。编译和链接过程的一项重要任务就是找到这些名称所对应的地址。假设变量 a、b、c 在内存中的地址分别是 0X1000、0X2000、0X3000，那么加法运算 c = a + b;将会被转换成类似下面的形式：

0X3000 = (0X1000) + (0X2000);

( )表示取值操作，整个表达式的意思是，取出地址 0X1000 和 0X2000 上的值，将它们相加，把相加的结果赋值给地址为 0X3000 的内存

变量名和函数名为我们提供了方便，让我们在编写代码的过程中可以使用易于阅读和理解的英文字符串，不用直接面对二进制地址，那场景简直让人崩溃。

需要注意的是，虽然变量名、函数名、字符串名和数组名在本质上是一样的，它们都是地址的助记符，但在编写代码的过程中，我们认为变量名表示的是数据本身，而函数名、字符串名和数组名表示的是代码块或数据块的首地址。

2、变量的定义

数据在内存中的地址也称为指针，如果一个变量存储了一份数据的指针，我们就称它为指针变量

在c语言中，允许用一个变量来存放指针，这种变量称为指针变量。指针变量的值就是某分数据的地址，这样的一份数据可以是数组，字符串，函数，也可以是另外的一个普通变量或者指针变量

现在假设有一个char类型的变量c，它存储了字符k，并占用了地址为0x11a的内存（地址通常用十六进制表示）另外有一个指针变量p，他的值为0x11a，正好等于变量c的地址，这种情况我们层p指向了c，或者说p是指向变量c的指针。

定义指针变量

定义指针变量与定义普通变量非常类似，不过要在变量名前加星号，格式为：

datatype *name;或者datatype *name = value;

*表示这是一个指针变量，datatype表示指针变量所指向的数据类型。例如：

int *p1;

P1是一个指向int类型数据的指针变量，至于P1酒精指向哪一份数据，应该由赋予它的值决定。再如：

int a = 100;
int *p_a = &a;

在定义指针变量P_a的同时对他进行初始化，并将变量a的地址赋予它，此时p_a就指向了a，值得注意的是，p_a需要的一个地址，a前面必须要加取地址符&，否则是不对的

和普通变量一样，指针变量也可以被多次写入，只要你想，随时都能改变指针变量的值，请看下面的代码

和普通变量一样，指针变量也可以被多次写入，只要你想，随时都能改变指针变量的值，请看下面的代码：

1. //定义普通变量
2. float a = 99.5, b = 10.6;
3. char c = '@', d = '#';
4. //定义指针变量
5. float *p1 = &a;
6. char *p2 = &c;
7. //修改指针变量的值
8. p1 = &b;
9. p2 = &d;

是一个特殊符号，表明一个变量是指针变量，定义P1,P2时必须待.而给P1,P2赋值时，因为已经知道了它是一个指针变量，就没必要多此一举带上*，后便可以像使用普通变量一样来使用指针变量，也就是说定义指针时必须带上*，给指针变量赋值时不能带*。

假设变量 a、b、c、d 的地址分别为 0X1000、0X1004、0X2000、0X2004，下面的示意图很好地反映了 p1、p2 指向的变化：

需要强调的是，P1,P2的类型分别是float和char，而不是float和char，他们是完全不同的数据类型，读者要引起注意。

指针变量也可以连续定义，例如：

int *a,*b,*c;

注意每个变量前面都要带*。如果写成下面的形式，那么只有 a 是指针变量，b、c 都是类型为 int 的普通变量：

int *a, b, c;

通过指针变量取得数据

指针变量存储了数据的地址，通过指针变量能够获得该地址上的数据，格式为：

*pointer;

这里的*称为指针运算符，用来取得某个地址上的数据，请看下面的例子：

1. #include <stdio.h>
2.
3. int main(){
4. int a = 15;
5. int *p = &a;
6. printf("%d, %d\\n", a, *p); //两种方式都可以输出a的值
7. return 0;
8. }

运行结果：

15.15

假设 a 的地址是 0X1000，p 指向 a 后，p 本身的值也会变为 0X1000，*p 表示获取地址 0X1000 上的数据，也即变量 a 的值。从运行结果看，*p 和 a 是等价的。

上节我们说过，CPU 读写数据必须要知道数据在内存中的地址，普通变量和指针变量都是地址的助记符，虽然通过*p 和 a 获取到的数据一样，但它们的运行过程稍有不同：a 只需要一次运算就能够取得数据，而 *p 要经过两次运算，多了一层“间接”。

假设变量 a、p 的地址分别为 0X1000、0XF0A0，它们的指向关系如下图所示：

程序被编译和链接后，a、p 被替换成相应的地址。使用 *p 的话，要先通过地址 0XF0A0 取得变量 p 本身的值，这个值是变量 a 的地址，然后再通过这个值取得变量 a 的数据，前后共有两次运算；而使用 a 的话，可以通过地址 0X1000 直接取得它的数据，只需要一步运算。

也就是说，使用指针是间接获取数据，使用变量名是直接获取数据，前者比后者的代价要高。

指针除了可以获取内存上的数据，也可以修改内存上的数据，例如：

1. #include <stdio.h>
2.
3. int main(){
4. int a = 15, b = 99, c = 222;
5. int *p = &a; //定义指针变量
6. *p = b; //通过指针变量修改内存上的数据
7. c = *p; //通过指针变量获取内存上的数据
8. printf("%d, %d, %d, %d\\n", a, b, c, *p);
9. return 0;
10. }

运行结果：

99；99；99；99

p 代表的是 a 中的数据，它等价于 a，可以将另外的一份数据赋值给它，也可以将它赋值给另外的一个变量。

**在不同的场景下有不同的作用：*可以用在指针变量的定义中，表明这是一个指针变量，以和普通变量区分开；使用指针变量时在前面加表示获取指针指向的数据，或者说表示的是指针指向的数据本身。

也就是说，定义指针变量时的和使用指针变量时的意义完全不同。以下面的语句为例：

1. int *p = &a;
2. *p = 100;

第 1 行代码中用来指明p是一个指针变量，第二行代码中用来获取指针指向的数据。

需要注意的是，给指针变量本身赋值时不能加*，修改上面的语句：

1. int *p;
2. p = &a;
3. *p = 100;

第二行代码中的p前面就不能加*

指针变量也可以出现在普通变量能出现的任何表达式中，例如：

1. int x, y, *px = &x, *py = &y;
2. y = *px + 5; //表示把x的内容加5并赋给y，*px+5相当于(*px)+5
3. y = ++*px; //px的内容加上1之后赋给y，++*px相当于++(*px)
4. y = *px++; //相当于y=(*px)++
5. py = px; //把一个指针的值赋给另一个指针

示例：通过指针交换两个变量的值

1. #include <stdio.h>
2.
3. int main(){
4. int a = 100, b = 999, temp;
5. int *pa = &a, *pb = &b;
6. printf("a=%d, b=%d\\n", a, b);
7. /*****开始交换*****/
8. temp = *pa; //将a的值先保存起来
9. *pa = *pb; //将b的值交给a
10. *pb = temp; //再将保存起来的a的值交给b
11. /*****结束交换*****/
12. printf("a=%d, b=%d\\n", a, b);
13. return 0;
14. }

运行结果： a=100, b=999 a=999, b=100

从运行结果可以看出。a，b的值已经发生了交换，需要注意的是临时变量temp，它的作用特别重要，因为执行*pa=*pb语句后，a的值会被b得知覆盖，如果不先将a的值保存起来以后就找不到了