详解UDP/TCP套接字
预备知识
理解源IP地址和目的IP地址
在IP数据包头部中, 有两个IP地址, 分别叫做源IP地址, 和目的IP地址
- 源IP地址:发送主机的IP地址。
- 目的IP地址:接收主机的IP地址。
认识端口号
端口号(port)是传输层协议的内容.
- 端口号是一个2字节16位的整数;
- 端口号用来标识一个进程, 告诉操作系统, 当前的这个数据要交给哪一个进程来处理;
- IP地址 + 端口号能够标识网络上的某一台主机的某一个进程;
- 一个端口号只能被一个进程占用
❓我们之前在学习系统编程的时候, 学习了 pid 表示唯一一个进程; 此处我们的端口号也是唯一表示一个进程. 那么还要用端口号呢?
💡1、解耦2、例如客户端需要找到服务器进程,因为进程每次创建销毁pid是会变的,而网络编程弄了个端口号,直接写死了是哪个进程,这样每次都能找到。
UDP/TCP套接字
TCP和UDP的性质
TCP:传输层协议 有连接 可靠传输 面向字节流
UDP:传输层协议 无连接 不可靠传输 面向数据报
网络字节序
我们已经知道,内存中的多字节数据相对于内存地址有大端和小端之分, 磁盘文件中的多字节数据相对于文件中的偏
移地址也有大端小端之分, 网络数据流同样有大端小端之分. 那么如何定义网络数据流的地址呢?
大小端详情请看:C语句:数据存储_说明中的语句找数据存储-CSDN博客
1、TCP/IP协议规定,网络数据流应采用大端字节序,即低地址存高字节,不管这台主机是大端机还是小端机
2、如果当前发送主机是小端, 就需要先将数据转成大端; 反之直接发送即可(不管本机是大端还是小端,最好都转换一下,便于日后跨平台、跨主机的需要)
3、发送主机和接收主机都是按照低地址到高地址发送/接收数据;
网络字节序和主机字节序的转换:
#include <arpa/inet.h>
uint32_t htonl(uint32_t hostlong); //主机转网络
uint16_t htons(uint16_t hostshort); //网络转主机
uint32_t ntohl(uint32_t netlong); //按4字节为单位主机转网络
uint16_t ntohs(uint16_t netshort); //按2字节网络转主机
这些函数名很好记,h表示主机,n表示网络,l表示32位长整数,s表示16位短整数。
例如htonl表示将32位的长整数从主机字节序转换为网络字节序,例如将IP地址转换后准备发送。
如果主机是小端字节序,这些函数将参数做相应的大小端转换然后返回;
如果主机是大端字节序,这些 函数不做转换,将参数原封不动地返回
对ip地址进行转换:
INET(3)
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
int inet_aton(const char *cp, struct in_addr *inp);
in_addr_t inet_addr(const char *cp);//将字符串转uint32_t的同时转为网络字节序
in_addr_t inet_network(const char *cp);
char *inet_ntoa(struct in_addr in);//将32位IPv4地址(in_addr结构体)转换成点分十进制字符串形式的IP地址
struct in_addr inet_makeaddr(int net, int host);
in_addr_t inet_lnaof(struct in_addr in);
in_addr_t inet_netof(struct in_addr in);
socket编程接口
socket常见API:
创建 socket 套接字 (TCP/UDP, 客户端 + 服务器)
int socket(int domain, int type, int protocol);
绑定端口号 (TCP/UDP, 服务器)
int bind(int socket, const struct sockaddr *address, socklen_t address_len);
开始监听socket (TCP, 服务器)
int listen(int socket, int backlog);
接收请求 (TCP, 服务器)
int accept(int socket, struct sockaddr* address, socklen_t* address_len);
建立连接 (TCP, 客户端)
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
sockaddr结构:
socket API是一层抽象的网络编程接口,适用于各种底层网络协议,如IPv4、IPv6,以及后面要讲的UNIX Domain
Socket. 然而, 各种网络协议的地址格式并不相同.
套接字不仅支持跨网络的进程间通信(网络套接字),还支持本地的进程间通信(域间套接字)。
为了让套接字的网络通信和本地通信能够使用同一套函数接口,于是就出现了sockeaddr结构体,该结构体与sockaddr_in和sockaddr_un的结构都不相同,但这三个结构体头部的16个比特位都是一样的,这个字段叫做协议家族。
IPv4和IPv6的地址格式定义在netinet/in.h中,IPv4地址用sockaddr_in结构体表示,包括16位地址类型, 16
位端口号和32位IP地址.
IPv4、IPv6地址类型分别定义为常数AF_INET、AF_INET6. 这样,只要取得某种sockaddr结构体的首地址,
不需要知道具体是哪种类型的sockaddr结构体,就可以根据地址类型字段确定结构体中的内容.
socket API可以都用struct sockaddr *类型表示, 在使用的时候需要强制转化成sockaddr_in; 这样的好
处是程序的通用性, 可以接收IPv4, IPv6, 以及UNIX Domain Socket各种类型的sockaddr结构体指针做为
参数
sockaddr 结构:
sockaddr_in 结构:
虽然socket api的接口是sockaddr, 但是我们真正在基于IPv4编程时, 使用的数据结构是sockaddr_in; 这个结构里主
要有三部分信息: 地址类型, 端口号, IP地址.
in_addr结构
in_addr用来表示一个IPv4的IP地址. 其实就是一个32位的整数;
UDP套接字:
UDP服务器创建流程
1、创建套接字(socket)
2、绑定端口号和IP地址。这个端口号是写死的,这个IP地址0.0.0.0或htonl(INADDR_ANY)两种写法(bind)
3、发送、接收数据,对数据进行处理(recvfrom/sendto)
创建socket套接字:
SOCKET(2)
#include <sys/types.h>
#include <sys/socket.h>
int socket(int domain, int type, int protocol);
用途:创建 socket 文件描述符 (TCP/UDP, 客户端 + 服务器)
参数:
domain:指定套接字的协议族。常见的协议族有AF_INET(IPv4网络通信)、AF_UNIX/AF_LOCAL(本地通信)
type:指定套接字的类型。常见的类型有SOCK_STREAM(流套接字)和SOCK_DGRAM(数据报套接字)。
protocol:给0就行。【指定套接字使用的协议。常见的协议有IPPROTO_TCP(TCP协议)和IPPROTO_UDP(UDP协议)】
调用成功返回值:返回一个文件描述符;调用失败返回值:返回-1,设置error变量以指示原因。
绑定套接字对应的IP地址、端口号:
BIND(2)
#include <sys/types.h>
#include <sys/socket.h>
int bind(int sockfd, const struct sockaddr *addr,socklen_t addrlen);
用途:将一个套接字(socket)与一个特定的IP地址和端口号绑定
参数:
sockfd:套接字描述符,即要绑定的套接字。
addr:一个指向 sockaddr 结构体的指针,该结构体包含了IP地址和端口号等信息。
addrlen:sockaddr 结构体的大小
返回值:返回值为0,则表示函数执行成功;否则,返回值为-1,表示函数执行失败。在函数执行失败时,可以通过 errno 全局变量获取错误码,以便进行错误处理。
客户端、服务器数据的接收与发送
UDP 套接字是无连接协议,必须使用recvfrom函数接收数据,sendto函数发送数据:
RECV(2)
#include <sys/types.h>
#include <sys/socket.h>
ssize_t recv(int sockfd, void *buf, size_t len, int flags);
ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags,
struct sockaddr *src_addr, socklen_t *addrlen);
ssize_t recvmsg(int sockfd, struct msghdr *msg, int flags);
用途:从已连接的socket中接收数据,并将数据存储到指定的缓冲区中。
参数:
sockfd:已经建立好连接的socket。
buf:指向接收数据存放的缓冲区。
len:缓冲区长度。
flags:一般为0,阻塞式读取。
src_addr:(输出参数)返回发送方的地址信息。
addrlen:(输出参数)地址信息的长度。
调用成功返回值:函数成功接收到数据时,它会返回接收到的字节数调用失败返回值:发生错误,则返回-1,并设置errno变量以指示错误类型。
SEND(2)
#include <sys/types.h>
#include <sys/socket.h>
ssize_t send(int sockfd, const void *buf, size_t len, int flags);
ssize_t sendto(int sockfd, const void *buf, size_t len, int flags,
const struct sockaddr *dest_addr, socklen_t addrlen);
ssize_t sendmsg(int sockfd, const struct msghdr *msg, int flags);
用途:该函数用于将数据报发送到指定的目的地。
参数:
sockfd:表示要发送数据的套接字文件描述符。
buf:指向要发送的数据缓冲区。
len:表示要发送的数据长度。
flags:表示发送数据的选项,常用的选项有MSG_DONTWAIT和MSG_NOSIGNAL。
dest_addr:(输入参数)指向目的地址的结构体指针,表示要发给谁。
addrlen:(输入参数)表示目的地址结构体的长度。
返回值:成功发送的字节数,如果返回值为-1,则表示发送失败,具体错误码可以通过errno变量获取。
TCP套接字:
TCP服务器创建流程
1、创建监听套接字(socket)
2、绑定端口号和IP地址。这个端口号是写死的,这个IP地址0.0.0.0或htonl(INADDR_ANY)两种写法(bind)
3、服务器设置socket为监听状态(listen)
4、服务器获取客户端连接请求(accept)
5、文件操作进行读写通信(read/write)
TCP客户端创建流程
1、创建套接字(socket)
2、客户端需要bind,但是客户端的绑定不需要我们自己写,操作系统会去绑定;(无需程序员bind)
3、客户端发起连接请求(connect)
4、文件操作进行读写通信(read/write)
创建socket套接字
同UDP创建套接字的方法,只不过在传参时UDP传入SOCK_DGRAM(数据报),而TCP传入SOCK_STREAM(字节流)
_sockfd=socket(AF_INET,SOCK_DGRAM,0);//UDP网络通信+数据报
_listenfd=socket(AF_INET,SOCK_STREAM,0);//TCP网络通信+字节流
绑定套接字对应的IP地址、端口号
同UDP。
服务器设置socket为监听状态
因为TCP是有连接的协议,需要使用listen函数将一个套接字设置为监听状态。
LISTEN(2)
#include <sys/types.h> /* See NOTES */
#include <sys/socket.h>
int listen(int sockfd, int backlog);
用途: listen函数用于将一个套接字(socket)设置为监听模式,以便接受客户端的连接请求。
参数:
sockfd:需要设置为监听模式的套接字描述符
backlog:指定等待连接队列的最大长度,即同时能够处理的客户端连接请求的最大数量,超过这个数量的连接请求将被拒绝
调用成功返回值:成功返回0调用失败返回值:失败返回-1,并设置errno变量以指示错误类型。
服务器获取客户端连接请求
ACCEPT(2)
#include <sys/types.h> /* See NOTES */
#include <sys/socket.h>
int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);
用途:accept函数用于从处于监听状态的套接字队列中取出一个已经完成了三次握手的连接请求,并创建一个新的套接字用于与客户端进行通信。
参数:
sockfd:处于监听状态的套接字描述符
addr:指向一个sockaddr结构体的指针,用于存储客户端的地址信息
addrlen:addr结构体的长度,需要在调用前初始化为sizeof(struct sockaddr)
调用成功返回值:返回一个新的套接字描述符,用于与客户端进行通信,这个新的套接字描述符是唯一的,只能用于与这个客户端进行通信。调用失败返回值:失败返回-1,并设置errno变量以指示错误类型。
客户端发起连接请求
CONNECT(2)
#include <sys/types.h> /* See NOTES */
#include <sys/socket.h>
int connect(int sockfd, const struct sockaddr *addr,socklen_t addrlen);
用途:connect函数用于客户端与服务器建立连接,自动帮客户端的套接字与其ip、port进行绑定。
参数:
sockfd:需要连接的套接字描述符。
addr:指向目标地址的指针,包括目标计算机的IP地址和端口号。
addrlen:addr结构体的长度,需要在调用前初始化为sizeof(struct sockaddr)
调用成功返回值:返回0调用失败返回值:失败返回-1,并设置errno变量以指示错误类型。
守护进程:
守护进程也称精灵进程,本质上是一个孤儿进程。
一个会话只有一个前台程序和n个后台程序,作业之间可以前后台转换。这样的任务可能会收到用户登录和注销而被清理。
如果想让服务端不受用户登录注销的影响,就必须让服务端自成会话,自成进程组,使其与终端设备的状态无关,可以一直运行的进程。这样的进程就被称为守护进程。
手搓用setsid
SETSID(2)
#include <unistd.h>
pid_t setsid(void);
用途:使用setsid可以使调用进程成为一个新的会话领导者,并且不会受到终端的控制。这对于守护进程和后台进程非常有用,因为它们需要在后台运行,并且不希望受到终端的影响。调用setsid后,调用进程的进程组ID将变为新会话的组ID,该进程成为新会话的领导进程,并且不再有控制终端。进程组的组长不能调用setsid()函数来创建一个新的会话
参数:无
调用成功返回值:返回新会话的会话ID
调用失败返回值:失败返回-1
当然Linux自带生成守护进程的接口:
DAEMON(3)
#include <unistd.h>
int daemon(int nochdir, int noclose);
用途:该函数的意义在于将进程转变为守护进程,守护进程是在后台运行的进程,通常不与控制台交互,而是在后台执行某些任务,如网络服务器等。通过调用该函数,可以实现以下功能:
将当前进程的父进程置为init进程(进程id为1),从而脱离原有的进程组和会话。
将当前进程的工作目录切换到根目录下,以避免守护进程因为当前工作目录被卸载等原因导致崩溃。
关闭标准输入、输出和错误输出,以避免守护进程输出信息到控制台,从而影响用户体验。
参数:nochdir:是否改变当前工作目录。如果为0,则将当前工作目录切换到根目录下,否则保持不变。
noclose:是否关闭标准输入、标准输出、标准错误的文件描述符。如果为0,则不关闭,否则关闭。
调用成功返回值:返回0调用失败返回值:失败返回-1,并设置errno变量。
> 用途:该函数的意义在于将进程转变为守护进程,守护进程是在后台运行的进程,通常不与控制台交互,而是在后台执行某些任务,如网络服务器等。通过调用该函数,可以实现以下功能:
>
> 将当前进程的父进程置为init进程(进程id为1),从而脱离原有的进程组和会话。
> 将当前进程的工作目录切换到根目录下,以避免守护进程因为当前工作目录被卸载等原因导致崩溃。
> 关闭标准输入、输出和错误输出,以避免守护进程输出信息到控制台,从而影响用户体验。
> 参数:
>
> nochdir:是否改变当前工作目录。如果为0,则将当前工作目录切换到根目录下,否则保持不变。
> noclose:是否关闭标准输入、标准输出、标准错误的文件描述符。如果为0,则不关闭,否则关闭。
> 调用成功返回值:返回0
>
> 调用失败返回值:失败返回-1,并设置errno变量。