(一)套接字Socket概念
Socket 中文意思是“插座”,在 Linux 环境下,用于表示进程 x 间网络通信的特殊文件
类型。本质为内核借助缓冲区形成的伪文件。
既然是文件,那么理所当然的,我们可以使用文件描述符引用套接字。Linux 系统将其封装成文件的目的是为了统一接口,使得读写套接字和读写文件的操作一致。
在 TCP/IP 协议中,“IP 地址+TCP 或 UDP 端口号”唯一标识网络通讯中的一个进程。
“IP 地址+端口号”就对应一个 socket。 欲建立连接的两个进程各自有一个 socket 来标识,那么这两个 socket 组成的 socket pair 就唯一标识一个连接。因此可以用 Socket 来描述网络连接的一对一关系。
在网络通信中,套接字一定是成对出现的。一端的发送缓冲区对应对端的接收缓冲区。我们使用同一个文件描述符索发送缓冲区和接收缓冲区。
(二)TCP通信流程图
(三)Socket编程基础知识
1 网络字节序
在计算机世界里,有两种字节序:
大端字节序 - 低地址高字节,高地址低字节
小段字节序 - 低地址低字节,高地址高字节
内存中的多字节数据相对于内存地址有大端和小端之分,磁盘文件中的
多字节数据相对于文件中的偏移地址也有大端小端之分。网络数据流同样有
大端小端之分,那么如何定义网络数据流的地址呢?发送主机通常将发送缓
冲区中的数据按内存地址从低到高的顺序发出,接收主机把从网络上接到的
字节依次保存在接收缓冲区中,也是按内存地址从低到高的顺序保存,因此,
网络数据流的地址应这样规定:先发出的数据是低地址,后发出的数据是高
地址。
TCP/IP 协议规定,网络数据流应采用大端字节序,即低地址高字节。
为使网络程序具有可移植性,使同样的 C 代码在大端和小端计算机上编译后
都能正常运行,可以调用以下库函数做网络字节序和主机字节序的转换。
#include <arpa/inet.h>
uint32_t htonl(uint32_t hostlong);
uint16_t htons(uint16_t hostshort);
uint32_t ntohl(uint32_t netlong);
uint16_t ntohs(uint16_t netshort);
h 表示 host,n 表示 network,l 表示 32 位长整数,s 表示 16 位短整数。
如果主机是小端字节序,这些函数将参数做相应的大小端转换然后返回,如
果主机是大端字节序,这些函数不做转换,将参数原封不动地返回。
2 socketaddr 数据结构
很多网络编程函数诞生早于 IPv4 协议,那时候都使用的是 sockaddr 结构体, 为了向前兼容,现在 sockaddr 退化成了(void *)的作用,传递一个地址给
函数,至于这个函数是 sockaddr_in 还是其他的,由地址族确定,然后函数
内部再强制类型转化为所需的地址类型
struct sockaddr {
sa_family_t sa_family; /* 地址系列,AF_xxx */
char sa_data[14]; /* 14字节的协议地址 */
};
struct sockaddr_in {
sa_family_t sin_family; /* 地址族:一般为AF_INET */
in_port_t sin_port; /* 按网络字节顺序排列的端口*/
struct in_addr sin_addr; /* 网络地址 */
};
/* 网络地址 */
struct in_addr {
uint32_t s_addr; /* 按网络字节顺序排列的网络地址 */
};
IPv4 地址用 sockaddr_in 结构体表示,包括 16 位端口号和 32 位 IP 地址
,但是 sock API 的实现早于 ANSI C 标准化,那时还没有 void *类型,
因此这些像 bind 、accept 函数的参数都用 struct sockaddr * 类型表示,
在传递参数之前要强制类型转换一下,例如:
struct sockaddr_in servaddr;
bind(listen_fd, (struct sockaddr *)&servaddr, sizeof(servaddr));
3 IP地址转换函数
对于IP地址"a.b.c.d"
小端字节序和大端字节序分别表示:
#include <arpa/inet.h>
int inet_pton(int af, const char *src, void *dst);
const char * inet_ntop(int af, const void *src, char *dst, socklen_t size);
af 取值可选为 AF_INET 和 AF_INET6 ,即对应IPv4 和 IPv6
其中 inet_pton 和 inet_ntop 不仅可以转换 IPv4 的 in_addr,
还可以转换 IPv6的 in6_addr。
因此函数接口是 void *dst 和 void *src。
(四)Socket 编程主要的函数介绍
1 套接字设置 socket()
头文件:
#include <sys/types.h>
#include <sys/socket.h>
函数原型:
int socket(int domain, int type, int protocol);
参数解释:
domain:
AF_INET 使用 TCP 或 UDP 来传输,用Pv4 的地址
AF_INET6 与AF_INET类似,不过是来用 IPv6 的地址
AF_UNIX 本地协议,使用在 Unix 和 Linux 系统上,一般都是当客户端和服
务器在同一台及其上的时候使用
type:
SOCK_STREAM 这个协议是按照顺序的、可靠的、数据完整的基于字节流的连接。
这是一个使用最多的socket 类型,这个socket 是使用TCP来进行传输。
SOCK_DGRAM 这个协议是无连接的、固定长度的传输调用。该协议是不可靠的,
使用 UDP 来进行它的连接。
SOCK_SEQPACKET 该协议是双线路的、可靠的连接,发送固定长度的数据包进行传输。
必须把这个包完整的接受才能进行读取。
SOCK_RAW socket类型提供单一的网络访问,这个 socket 类型使用 ICMP 公共协议。
SOCK_RDM 这个类型是很少使用的,在大部分的操作系统上没有实现,
它是提供给数据链路层使用,不保证数据包的顺序
protocol:
传 0 表示使用默认协议。
返回值:
成功:返回指向新创建的 socket 的文件描述符
失败:返回-1,设置 errno
注意事项:
对于 IPv4,domain 参数指定为 AF_INET。对于 TCP 协议,type 参数指定为 SOCK_STREAM,表示面向流的传输协议。如果是UDP协议,则type参数指定为SOCK_DGRAM,表示面向数据报的传输协议。protocol参数的指定为 0 即可。
2 绑定标签 bind()
头文件:
#include <sys/types.h>
#include <sys/socket.h>
函数原型:
int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
参数解释:
sockfd: socket 文件描述符
addr: 构造出 IP 地址加端口号
addrlen: sizeof(addr)长度
返回值:
成功: 返回 0
失败: 返回-1, 设置 errno
注意事项:
服务器程序所监听的网络地址和端口号通常是固定不变的,客户端程序得知
服务器程序的地址和端口号后就可以向服务器发起连接,因此服务器需要调用
bind 绑定一个固定的网络地址和端口号。
bind()的作用是将参数 sockfd 和 addr 绑定在一起,使 sockfd 这个用于网
络通讯的文件描述符监听 addr 所描述的地址和端口号。前面讲过,struct
sockaddr *是一个通用指针类型,addr 参数实际上可以接受多种协议的 sockaddr
结构体,而它们的长度各不相同,所以需要第三个参数 addrlen 指定结构体的长
度。如:
struct sockaddr_in servaddr;
bzero(&servaddr, sizeof(servaddr));
servaddr.sin_family = AF_INET;
servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
servaddr.sin_port = htons(6666);
首先将整个结构体清零,然后设置地址类型为 AF_INET,网络地址为 INADDR_ANY,
这个宏表示本地的任意 IP 地址,因为服务器可能有多个网卡,每个网卡也可能
绑定多个 IP 地址, 这样设置可以在所有的 IP 地址上监听,直到与某个客户端建
立了连接时才确定下来到底用哪个 IP 地址和端口号。
3 设置监听 listen()
头文件:
#include <sys/types.h>
#include <sys/socket.h>
函数原型
int listen(int sockfd, int backlog);
参数解释:
sockfd: socket 文件描述符
backlog: 在 Linux 系统中,它是指排队等待建立 3 次握手队列长度
注意事项:
查看系统默认 backlog
cat /proc/sys/net/ipv4/tcp_max_syn_backlog
改变 系统限制的 backlog 大小
vim /etc/sysctl.conf
最后添加
net.core.somaxconn = 1024
net.ipv4.tcp_max_syn_backlog = 1024
保存,然后执行
sysctl -p
4 接受连接 accept()
头文件:
#include <sys/types.h>
#include <sys/socket.h>
函数原型:
int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);
参数解释:
sockdf: socket 文件描述符
addr: 传出参数,返回链接客户端地址信息,含 IP 地址和端口号
addrlen: sizeof(addr)大小,函数返回时返回真正接收到地址结构体的大小
返回值:
成功: 返回一个新的 socket 文件描述符,用于和客户端通信,
失败: 返回-1,设置 errno
注意事项:
三次握手完成后,服务器调用 accept()接受连接,如果服务器调用 accept()
时还没有客户端的连接请求,就阻塞等待直到有客户端连接上来。addr 是一个
传出参数,accept()返回时传出客户端的地址和端口号。addrlen 参数是一个传
入传出参数,传入的是调用者提供的缓冲区 addr的长度以避免缓冲区溢出问题,
传出的是客户端地址结构体的实际长度(有可能没有占满调用者提供的缓冲区)。
如果给 addr 参数传 NULL,表示不关心客户端的地址。
服务器程序结构是这样的:
while (1) {
cliaddr_len = sizeof(cliaddr);
connfd = accept(listenfd, (struct sockaddr *)&cliaddr,&cliaddr_len);
n = read(connfd, buf, MAXLINE);
......
close(connfd);
}
整个是一个 while 死循环,每次循环处理一个客户端连接。由于 cliaddr_len
是传入传出参数,每次调用 accept()之前应该重新赋初值。 accept()的参数
listenfd 是先前的监听文件描述符,而 accept()的返回值是另外一个文件描述
符 connfd, 之后与客户端之间就通过这个 connfd 通讯,最后关闭 connfd 断开
连接,而不关闭 listenfd,再次回到循环开头 listenfd 仍然用作 accept 的参
数。accept()成功返回一个文件描述符,出错返回-1。
5 请求连接 connect()
头文件:
#include <sys/types.h>
#include <sys/socket.h>
函数原型:
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
参数解释:
sockdf: socket 文件描述符
addr: 传入参数,指定服务器端地址信息,含 IP 地址和端口号
addrlen: 传入参数,传入 sizeof(addr)大小
返回值:
返回值: 成功返回 0,失败返回-1,设置 errno
注意事项:
客户端需要调用 connect()连接服务器,connect 和 bind 的参数形式一致,
区别在于bind的参数是自己的地址,而connect的参数是对方的地址。
(五)应用实例
1 服务端demo代码
#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <string.h>
#include <ctype.h>
#include <arpa/inet.h>
#define SERVER_PORT 6666
int main(void) {
//1创建连接的套接字
int sock;
sock = socket(AF_INET, SOCK_STREAM, 0);//IPV4,TCP方式,默认协议
//2设置标签(地址,端口号)
struct sockaddr_in server_addr;
bzero(&server_addr, sizeof(server_addr)); //将server_addr的内容清零
server_addr.sin_family = AF_INET; //协议组IPV4
server_addr.sin_addr.s_addr = htonl(INADDR_ANY); //监听本地所有ip
server_addr.sin_port = htons(SERVER_PORT); //设置端口号
//3绑定标签
bind(sock, (struct sockaddr*)&server_addr, sizeof(server_addr));
//4设置监听并指定监听最大数量
listen(sock, 128);
//5等待连接
printf("等待客户端连接请求\n");
int done = 1;
while (done) {
//5-1有连接则重新分配套接字接受连接
struct sockaddr_in clinet;
int client_sock, len; //客户端的 套接字
char client_ip[64]; //客户端的 ip
char buf[256]; //客户端的 发送的内容
socklen_t client_addr_len; //套接字地址结构长度
client_addr_len = sizeof(clinet);
//5-2接受分配的套接字
client_sock = accept(sock, (struct sockaddr*)&clinet, &client_addr_len);
//5-3查看客户端IP和端口号
inet_ntop(AF_INET, &clinet.sin_addr.s_addr, client_ip, sizeof(client_ip));
printf("客户端IP:%s ,端口号:%d\n", client_ip, ntohs(clinet.sin_port));
//5-4客户端发来的数据
len = read(client_sock, buf, sizeof(buf) - 1);
buf[len] = '\0';
printf("收到客户端发来的长度为%d数据%s\n", len, buf);
//5-4服务端给客户写数据
len = write(client_sock, buf, len);
printf("已完成对客户端的写操作\n");
close(client_sock);
}
close(sock);
return 0;
}
2 客户端demo代码
#include<stdlib.h>
#include<stdio.h>
#include<string.h>
#include<unistd.h>
#include<sys/socket.h>
#include<arpa/inet.h>
#define SERVER_PORT 6666
#define SERVER_IP "127.0.0.1"
int main(int argc,char **argv) {
int sockfd;
char* message;
struct sockaddr_in servaddr;
int n;
char buf[64];
if (argc!=2)//参数不合法
{
printf("参数不合法! ./xxxx.exe message\n");
exit(-1);
}
message = argv[1];//获取要发送的消息
printf("待发送的数据:%s\n",message);
//创建套接字
sockfd = socket(AF_INET,SOCK_STREAM,0);
//将server_addr的内存初始化
memset(&servaddr,'\0',sizeof(struct sockaddr_in));
servaddr.sin_family = AF_INET;
inet_pton(AF_INET,SERVER_IP,&servaddr.sin_addr);
servaddr.sin_port=htons(SERVER_PORT);
//连接服务器
connect(sockfd, (struct sockaddr*)&servaddr,sizeof(servaddr));
//写数据
write(sockfd,message,strlen(message));
//读数据
n = read(sockfd,buf,sizeof(buf)-1);
if (n>0) {
buf[n] = '\0';
printf("收到的数据:%s\n",buf);
}
else {
perror("error!!!");
}
printf("finished\n");
close(sockfd);
return 0;
}