目录
一,socket编程的相关说明
1-1,sockaddr结构体
1-2,Socket API
二,基于Udp协议的简单通信
三,UDP套接字的应用
3-1,实现英译汉字典
一,socket编程的相关说明
Socket编程是一种网络通信编程技术,它允许两个或多个程序在网络上相互通信,无论这些程序是否运行在同一台计算机上。
在Socket编程中,每个网络通信端点都被称为一个套接字(封装了底层的网络协议,如TCP/IP的细节)。这个套接字支持不同的传输协议,可以看作是两个程序之间打开的一个通信通道,通过这个通道,程序可以在网络上进行数据的传输。
不同主机在网络上进行数据传输时需要拿到拿到对方的端口号(标识主机的应用程序或网络服务,在网络通信中确保将数据包交给哪个主机上的应用程序来处理)和IP地址(互联网上每一台计算机的地址,在网络通信中用于标识主机的位置)。IP地址用于寻找指定机器,找到指定机器后,就需要端口号来找到指定机器下的指定服务或程序。
注意:服务端通常不会给予特定的IP地址。首先,如果指定服务端的IP地址,那么服务端程序只能在特定的网络环境中运行,要是网络环境发生变化(例如,服务器迁移到新的IP地址),则需要重新编译和部署程序。其次,在很多的场景中,服务端程序不仅需要部署在多个服务器上,还需要在不同的机器和网络环境中运行,具有多个网络接口,它的IP地址也可能会动态变化。这时,若多个客户端连接到一个服务端上,指定特定的IP地址会导致连接出错等问题。
1-1,sockaddr结构体
Socket编程中,struct sockaddr
结构体是常用的类型操作,该结构体是用于描述套接字地址的通用结构体,并指定或返回网络地址信息,是一个通用的地址结构体,它通常出现在套接字函数的参数中,在网络编程中广泛使用。运用时,由于网络地址协议格式各有不同,所以该结构体通常会被更具体的地址结构体(如 struct sockaddr_in
或 struct sockaddr_in6
)所替代,这些结构体提供了更详细的地址信息,需要时,一般都是通过指针将sockaddr
进行强制转换,具体使用请看后面代码。
struct sockaddr_in
是基于IPv4编程的网络环境中使用的数据结构。这个结构里主要有三部分信息:地址类型、端口号、IP地址。
struct sockaddr_in
{
地址族,对于 IPv4 来说是 AF_INET
注意:地址族是将不同的网络层协议(如IPv4、IPv6等)进行分类的一种方式。它允许网 络设备根据地址族来识别和处理不同协议的数据包,指定源字符串的地址类型。一般用 于区分IPv4和IPv6。
sa_family_t sin_family;端口号,由于端口号也需要经过网络传送(网络通信时需要拿到对方的端口号进行通 信),所以传递网络前需要使用 htons()函数将其转换为网络字节序
uint16_t sin_port;包含一个 32 位IPv4 地址的结构体
struct in_addr sin_addr;
用来将结构大小填充到与 struct sockaddr 相同的大小,通常被设置为零。
char sin_zero[8];
};typedef uint32_t in_addr_t;
struct in_addr
{
in_addr_t s_addr; 一个 32 位的IPv4 地址
};
注意:
1,网络数据传输时,IP地址也需要经过网络传输,所以这里需要把点分十进制的IP地址(字符串类型)转换成网络字节序
2,
inet_addr()
用来表示一个IPv4的IP地址(32位的整数)。通常使用inet_pton()
或inet_addr()
函数来将点分十进制的 IPv4 地址字符串转换为4字节的网络字节序(大端序)3,
inet_pton()
和inet_addr()
虽然都是用于将IP地址(字符串形式)转换为网络字节序的二进制形式,但是,inet_pton()
不仅支持IPv4,还支持 IPv6 地址的转换,除此外,inet_pton()
通常还是线程安全的(inet_addr()
可能不是线程安全的)。inet_pton()
是较新的函数,提供了更广泛的功能和更好的错误处理,但是该函数运用起来比较复杂。4,当网络IP地址传送到主机上时,需要用特定的函数(比如:inet_ntoa())将其转换成点分十进制的字符串形式。
inet_addr:
格式:in_addr_t inet_addr(const char *cp);
参数:
cp
:指向一个以空字符结尾的字符串,该字符串表示一个点分十进制格式的IPv4 地址(例如,"192.168.1.1")。返回值:成功时,返回该IP地址的网络字节序表示(一个
in_addr_t
类型的值)。如果 输入字符串不是有效的IPv4地址,函数返回INADDR_NONE
(通常是-1
,在<netinet/in.h>
头文件中定义)。inet_pton:
格式:int inet_pton(int af, const char *src, void *dst);
参数:
af
:地址族。一般是AF_INET
或AF_INET6
src
:指向一个以空字符结尾的字符串,该字符串表示一个点分十进制格式的IPv4 地址(AF_INET
)或十六进制格式的IPv6地址(AF_INET6
)
dst
:指向一个缓冲区,该缓冲区存储转换后的网络字节序地址返回值:
成功时,返回
1。
如果输入字符串不是有效的地址格式,返回
0。
如果发生系统级错误(例如,参数不合法),返回
-1。
inet_ntoa:
功能:将网络字节序的二进制IP地址转换为点分十进制的IP地址字符串
格式:char *inet_ntoa(struct in_addr in);
参数:in:表示一个32位的IPv4地址的结构体,即需要转换网络字节序的二进制IP地址
返回值:成功时,返回一个表示点分十进制的IP地址的字符串;失败时,返回NULL。
1-2,Socket API
socket API是一层抽象的网络编程接口,其中,API代表应用程序编程接口。在socket编程中,API提供了一系列用于网络通信的函数和接口。这些API函数封装了底层网络通信的复杂性,为开发者提供了简单而强大的接口。通过API,应用程序可以调用操作系统或其他软件服务提供的函数和程序,以实现特定的功能或操作。常见的socket API包括:
1,socket。用于创建一个新的套接字,相关说明如下:
头文件:
#include <sys/types.h>
#include <sys/socket.h>格式:
int socket(int domain, int type, int protocol);
参数说明:
- domain:指定通信时使用的协议族。常用的协议族有:
AF_INET
:IPv4的协议族。IPv4地址类型定义在常数AF_INET中AF_INET6
:IPv6的协议族。IPv6地址类型定义在常数AF_INET6中AF_UNIX
或AF_LOCAL
:本地通信协议族(通常用于同一台机器上的进程间通信)。- type:指定套接字类型。常用的套接字类型有:
SOCK_STREAM
:流式套接字,用于TCP连接。SOCK_DGRAM
:数据报套接字,用于UDP连接。SOCK_RAW
:原始套接字,允许对IP层及以下的数据进行直接访问和操作。- protocol:通常设置为0,表示自动选择该domain和type组合下的默认协议。特殊情况下会设置特定的协议,这里先不考虑。
返回值:
成功时,该函数返回一个非负数的套接字描述符(也可以理解为文件描述符,因为Linux一切皆文件),该描述符在后续的网络操作中用于标识该套接字;失败时,返回-1。
2,bind。函数用于将一个套接字与一个特定的地址(通常是IP地址和端口号,即sockaddr结构体)关联起来。在服务器程序中,这通常是第一步,因为服务器需要在一个特定的端口上监听来自客户端的连接请求,即绑定端口号。
注意:在计算机网络编程中,bind
函数主要用于服务器端,而不是客户端。服务端是确定的,需要绑定到一个特定的 IP 地址和端口号,需要在应用程序启动时绑定,以便客户端能够连接到它。客户端一般可以打开多个服务(比如:打开淘宝、百度、抖音等),若是使用bind
函数连接固定的端口号,可能会导致不同的网络服务使用到同一个端口号,导致服务冲突,因此客户端通常是在首次发送数据的时候由操作系统动态分配一个临时的端口号来进行通信,不需要使用专门函数绑定到特定的 IP 地址和端口号。然而,在某些特殊情况下(如需要确保客户端使用特定的端口号进行通信时),客户端也可以使用 bind
函数进行绑定。
头文件:
#include <sys/types.h>
#include <sys/socket.h>格式:
int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
参数说明:
sockfd
:要绑定套接字的文件描述符。addr
:指向一个sockaddr
结构的指针,该结构包含了要绑定的地址和端口信息。在实际使用中,通常会使用sockaddr_in
结构(基于IPv4地址)或sockaddr_in6
结构(基于IPv6地址)。addrlen
:addr
参数所指向的地址结构的长度。返回值:
成功时,返回0;失败时,返回-1。
3,listen。该函数用于将套接字设置为监听状态,以接受来自客户端的连接请求。这个函数通常在服务器程序中调用,在调用 bind
函数时将套接字与特定地址(IP地址和端口号)关联之后使用。
头文件:
#include <sys/types.h>
#include <sys/socket.h>格式:
int listen(int sockfd, int backlog);
参数说明:
sockfd
:要监听套接字的文件描述符。backlog
:指定系统内核应为相应套接字排队的最大连接数。一般设置为SOMAXCONN
,即使用系统定义的最大值。返回值:
成功时,返回0;失败时,返回-1。
4,recvfrom。该函数用于从套接字中接收数据,默认情况下,若 recvfrom
在没有数据可读的情况下被调用它将会阻塞等待。该函数特别是在处理无连接协议(如 UDP)时经常使用。
这里先说明下 socklen_t 类型,它是一个无符号整数类型,其长度至少为32位(具体大小可能因操作系统和平台而异),用于指定套接字地址结构的大小。
头文件:
#include <sys/types.h>
#include <sys/socket.h>格式:
ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags, struct sockaddr *src_addr, socklen_t *addrlen);
注意:
ssize_t是一个平台相关的类型,在32位机器上,ssize_t通常等同于int类型;在64位机器上,它通常等同于long int类型。
参数说明:
sockfd:套接字文件描述符,表示接收数据的套接字。
buf:指向接收数据缓冲区的指针。
len:指定缓冲区
buf
的大小,即最多可以接收的数据字节数。flags:通常设置为 0(可以是某些特性功能的字段,这里不做说明)。
src_addr:指向
sockaddr
结构的指针,用于存储发送方地址信息。如果不需要此信息,可以设置为NULL
。addrlen:指向一个在调用时包含
src_addr
结构大小的指针,在返回时包含实际写入src_addr
的大小。如果src_addr
是NULL
,则addrlen
也应该是NULL
。返回值:
成功时,返回接收到的字节数(如果连接已正常关闭,则返回 0);失败时,返回 -1。
5,sendto。该函数主要用于发送数据到指定的套接字,是网络编程中发送数据的函数之一。
头文件:
#include <sys/types.h>
#include <sys/socket.h>格式:
ssize_t sendto(int sockfd, const void *buf, size_t len, int flags, const struct sockaddr *dest_addr, socklen_t addrlen);
注意:
ssize_t是一个平台相关的类型,在32位机器上,ssize_t通常等同于int类型;在64位机器上,它通常等同于long int类型。
参数说明:
sockfd
:套接字文件描述符,表示要发送数据的套接字。buf
:指向包含要发送数据的缓冲区的指针。len
:要发送的数据的长度(以字节为单位)。flags
:通常设置为 0(可以是某些特性功能的字段,这里不做说明)。dest_addr
:指向sockaddr
结构体的指针,表示数据发送的目标地址信息。对于 TCP 连接,这个参数通常不需要,因为连接已经建立了目标地址;但对于 UDP,这个参数是必须的。addrlen
:dest_addr
结构体的大小。返回值:
成功时,返回发送的字节数;失败时,返回 -1。
socket API还有很多,我们暂时先了解这些,后面遇到需要时会进行说明。
二,基于Udp协议的简单通信
服务器的IP地址一般不指定,因此,下面程序实现时,我们将服务端的IP地址设为0(表示接收任意IP地址),这时只有端口号标识其服务端。
服务端的端口号我们使用输入的环境变量的方式来确定,形式为:【可执行文件】【十六位的端口号】。其它形式的输入全部出错。这时,客户端只要连接到指定输入服务器的端口号即可完成远程网络连接进行通信。通过服务端,我们可查看客户端的IP和端口号,下面代码演示会看到。
注意:云服务器的端口号默认都是禁止访问的,若要使用云服务器实现通信,首先需要自己开放云服务器的端口。至于如何开放云服务器的端口号请看此文章:云服务器端口开放
客户端创建套接字时不用使用bind函数进行绑定(系统会自动绑定)。
客户端运行的方式这里使用【可执行文件】【连接服务器的IP地址】【十六位的端口号】形式,其它形式的输入全部错误。
程序总代码请在此链接下观看:UdpSocket代码程序
三,UDP套接字的应用
3-1,实现英译汉字典
这里设置了Dict.txt字典文件,里面对应的是可以查找到的单词及对应的汉语,然后,在Dict.hpp 中,简单的实现了字典类的封装。这里需提一点,由于字典类需要将Dict.txt 文件中的数据加载到类中,所以这里我们使用C++文件流ifstream。
在C++中,ifstream
是一个类,用于从文件读取数据。它是C++标准库中的一部分,特别是属于输入输出(I/O)流库的一部分(输入文件流)。ifstream
继承自istream
类,因此它提供了所有从输入流中读取数据的功能,但专门用于文件输入。通过使用ifstream
,我们可以打开文件、读取文件内容、检查文件状态(如是否到达文件末尾),以及关闭文件等操作。相关的常用操作请在此链接下观看:ifstream文件流的使用
服务端 UdpServer.hpp 中,基于应用服务的实现一般是在 recvfrom 和 sendto函数之间实现。客户端发送的需要查找的单词传送给服务端后,服务端进行查找,将查找到的信息发送给客户端,这里我们使用 function 和 bind 包装器来实现这一功能。详细代码及说明请看此链接:英译汉字典的实现