文章目录
- Socket 编程
- 基本概念
- Socket背景
- Socket 为了解决什么问题
- socket
- sockaddr结构
- sockaddr
- sockaddr_in
- sockaddr 和 sockaddr_in 的关系
- sockaddr_un
- 示例代码
🎖 博主的CSDN主页:Ryan.Alaskan Malamute
📜 博主的代码仓库主页 [ Gitee ]:@ryanala [GitHub]: Ryan-Ala
Socket 编程
基本概念
Socket背景
Socket(套接字)是一种用于实现网络通信的编程接口(API),它提供了一种标准化的方式,使得不同操作系统和编程语言之间的应用程序能够相互通信。Socket最初是在BSD(Berkeley Software Distribution)操作系统中开发出来的,目的是为了实现在不同主机之间进行进程间通信。BSD是由加州大学伯克利分校开发的一个Unix操作系统的分支,它对Socket的定义和实现成为了事实上的标准。后来,由于互联网的发展,Socket被广泛应用于网络编程中。
在早期的计算机网络中,通信使用的是不同的协议,这些协议之间缺乏标准化的接口,使得应用程序的编写和移植变得非常困难。为了解决这个问题,一些计算机科学家开始研究如何定义一种标准的通信接口,以便不同的计算机之间能够进行通信。Socket就是在这个背景下诞生的,它提供了一种可移植、可扩展、易于使用的接口,使得应用程序能够在不同的操作系统和计算机之间进行通信。
随着互联网的发展,Socket成为了网络编程中不可或缺的一部分。它被广泛应用于各种网络应用程序中,如Web服务器、电子邮件客户端、聊天程序等。同时,随着计算机硬件和网络技术的不断发展,Socket也不断更新和完善,以适应新的应用场景和需求。
Socket 为了解决什么问题
Socket通信主要是为了解决计算机网络中的进程间通信问题。在网络编程中,有两个进程需要进行通信才能完成特定的任务,这两个进程可能运行在不同的计算机上,也可能运行在同一台计算机上的不同进程中。Socket提供了一种标准化的接口,使得这些进程能够在网络中进行数据交换和通信。具体来说,Socket通信可以解决以下几个方面的问题:
- 进程间通信:在同一台计算机上,不同的进程之间需要进行通信,Socket提供了一种标准化的接口,使得进程之间可以通过网络进行通信。
- 跨平台通信:不同的计算机、操作系统和编程语言之间需要进行通信,Socket提供了一种可移植的接口,使得应用程序可以在不同的平台上运行并进行通信。
- 网络通信安全性:网络通信中存在着信息泄露、数据篡改、拒绝服务攻击等安全问题,Socket可以通过加密、身份认证、防火墙等方式提高通信的安全性。
- 通信协议:Socket提供了一种灵活的通信协议,可以根据需要选择不同的协议来满足特定的通信需求,如TCP、UDP等协议。
总之,Socket通信可以为应用程序提供一种标准化、可靠、安全的网络通信方式,使得不同计算机之间的应用程序可以进行数据交换、信息共享和远程控制等操作。
简单来说
- socket编程也叫套接字编程,应用程序可以通过它发送或者接受数据,可对其像打开文件一样打开、关闭、读写等操作.
- 套接字允许应用程序将I/O插入到网络中,并与网络中的其他应用程序进行通信.
- 网络套接字是IP地址与端口号TCP协议的组合
- Socket就是为网络编程提供的一种机制,通信的两端都有Socket
- 网络通信其实就是Socket之间的通信,数据在两个Socket之间通过I/O进行传输.
socket
Socket 编程需要包含如下头文件
#include<sys/types.h>
#include<sys/socket.h>
函数原型:
int socket(int domain, int type, int protocol); // 2:46:00
//创建套接字就可以理解为创建了struct file对象其中包含了很多文件指针
// 该函数返回一个文件指针,套接字文件描述符,即代表socket函数创建的套接字文件
// 使用示例:
_sockfd = socket(AF_INET, SOCK_DGRAM, 0); // 创建一个网络通信的文件
if (_sockfd < 0)
{
// 如果错误,就打印日志
lg.LogMessage(Fatal, "socket error, %d : %s \n", errno, strerror(errno));
exit(Socket_Err);
}
-
domain
常用的三种阈
名称 含义 AF_UNIX 用于本地进程间的通信 AF_INET,PF_INET IPv4 Internet协议 PF_INET6 IPv6 Internet协议 -
AF:表示ADDRESS FAMILY 地址族
地址族就是一个协议族所使用的地址集合,也是用宏来表示不同的地址族,这个宏的形式是AF开头,比如IP地址族为AF_INET,
-
PF:表示PROTOCOL FAMILY 协议族
协议族就是不同协议的集合,在Linux中,用宏来表示不同的协议族,这个宏的形式是PF开头,比如IPv4协议族为PF_INET
-
区别:
地址族和协议族其实是一样的,值也一样,都是用来识别不同协议的,为什么要搞两套东西呢?
这是因为之前UNIX有两种风格系统:BSD系统和POSIX系统
- 对于BSD系统,一直用的是AF
- 对于POSIX系统,一直用的是PF。
Linux作为后起之秀,为了兼容,所以两种都支持,这样两种风格的UNIX下的软件就可以在Linux上运行了。
-
-
type
type用于设置套接字通信的类型,主要有SOCKET_STREAM(流式套接字)、SOCK_DGRAM(数据包套接字)
名称 含义 SOCK_STREAM Tcp 连接,提供序列化的、可靠的、双向连接的字节流。支持带外数据传输 SOCK_DGRAM UDP 连接(无连接状态的消息) SOCK_SEQPACKET 序列化包,提供一个序列化的、可靠的、双向的基本连接的数据传输通道,数据长度定常。每次调用读系统调用时数据需要将全部数据读出 SOCK_RAW RAW类型,提供原始网络协议访问 SOCK_RDM 提供可靠的数据报文,不过可能数据会有乱序 SOCK_PACKET 这是一个专用类型,不能呢过在通用程序中使用 -
protocol
-
protocol用于制定某个协议的特定类型,即type类型中的某个类型。通常某协议中只有一种特定类型,这样protocol参数仅能设置为0
-
但是有些协议有多种特定的类型,就需要设置这个参数来选择特定的类型。
-
-
errno
函数socket()并不总是执行成功,有可能会出现错误,错误的产生有多种原因,可以通过errno获得
值 含义 EACCES 没有权限建立制定的domain的type的socket EAFNOSUPPORT 不支持所给的地址类型 EINVAL 不支持此协议或者协议不可用 EMFILE 进程文件表溢出 ENFILE 已经达到系统允许打开的文件数量,打开文件过多 ENOBUFS/ENOMEM 内存不足。socket只有到资源足够或者有进程释放内存 EPROTONOSUPPORT 制定的协议type在domain中不存在
sockaddr结构
socket API是一层抽象的网络编程接口,适用于各种底层网络协议,如IPv4、IPv6,以及后面要讲的UNIX Domain Socket. 然而, 各种网络协议的地址格式并不相同.
sockaddr
在写代码前,需要先了解这三个结构间的关系,sockaddr结构体在如下头文件中定义
#include <sys/socket.h>
sockaddr的缺陷是:sa_data把目标地址和端口信息混在一起了
sockaddr 可以强转为 sockaddr_in 和 sockaddr_un,( 类似于父类子类的感觉 )
struct sockaddr
{
sa_family_t sin_family; //地址族
char sa_data[14]; //14字节,包含套接字中的目标地址和端口信息
};
- IPv4和IPv6的地址格式定义在netinet/in.h中,IPv4地址用sockaddr_in结构体表示,包括16位地址类型, 16位端口号和32位IP地址.
- IPv4、IPv6地址类型分别定义为常数AF_INET、AF_INET6. 这样,只要取得某种sockaddr结构体的首地址,不需要知道具体是哪种类型的sockaddr结构体,就可以根据地址类型字段确定结构体中的内容.
- socket API可以都用struct sockaddr *类型表示, 在使用的时候需要强制转化成sockaddr_in; 这样的好处是程序的通用性, 可以接收IPv4, IPv6, 以及UNIX Domain Socket各种类型的sockaddr结构体指针做为参数;
sockaddr_in
头文件
#include<netinet/in.h>
#include<arpa/inet.h>
此结构的地址类型为AF_INET,是网络套接字
-
sockaddr_in结构体是和sockaddr结构并列且等价的结构体,因此它们二者之间可以互相转化,也是真正用来提供给程序员进行填充操作的结构体
-
区别在于 sockaddr_in 将 sa_data 划分为 sin_port 和 sin_addr,也就是把端口和IP地址信息区分开,sin_port采用了网络字节序,同时为了保持和sockaddr相同的字节大小,填充了8字节的sin_zero。这也是一个只针对IPv4地址的结构体,因此它的 sin_family 只能是 AF_INET。
//简略版
struct sockaddr_in
{
__SOCKADDR_COMMON(sin_); //该项是个宏,在编译时会将 sin_ 和 family 拼接后形成成员 sin_famliy
in_port_t sin_port;
struct in_addr sin_addr
}
//详细版
struct sockaddr_in
{
__SOCKADDR_COMMON (sin_); // 此成员就是 sin_family , __SOCKADDR_COMMON 是一个宏,编译后 sin_ 后面会接上 family
in_port_t sin_port; /* Port number. */ // uint16_t 类型 16 位 TCP/UDP 端口号
struct in_addr sin_addr; /* Internet address. */ //32 位 IP 地址
/* Pad to size of `struct sockaddr'. */
unsigned char sin_zero[sizeof (struct sockaddr) -
__SOCKADDR_COMMON_SIZE -
sizeof (in_port_t) -
sizeof (struct in_addr)];
};
// in_addr 的类型 (32位IP地址)
typedef uint32_t in_addr_t;
struct in_addr
{
in_addr_t s_addr; // 32 位 IPv4 地址
};
使用示例:
注意,该结构体使用先进行置空
struct sockaddr_in local;
bzero(&local, sizeof(local)); // 将指定的内存清零
local.sin_family = AF_INET; // 告诉系统绑定的是网路通信的信息
local.sin_port = htons(_port); // _port 是主机序列,需要主机转网络序列
local.sin_addr.s_addr = inet_addr(_ip.c_str()); // sin.adder 是一个结构体,这个结构体里面只有一个成员
// 1. 将 _ip变为四字节ip 2. 变成网络序列
sockaddr 和 sockaddr_in 的关系
-
二者长度一样,都是16个字节,即占用的内存大小是一致的,因此可以互相转化。二者是并列结构,指向sockaddr_in结构的指针也可以指向sockaddr。
-
sockaddr常用于bind、connect、recvfrom、sendto等函数的参数,指明地址信息,是一种通用的套接字地址。
-
sockaddr_in 是internet环境下套接字的地址形式。所以在网络编程中我们会对sockaddr_in结构体进行操作,使用sockaddr_in来建立所需的信息,最后使用类型转化就可以了。一般先把sockaddr_in变量赋值后,强制类型转换后传入用sockaddr做参数的函数:sockaddr_in用于socket定义和赋值;sockaddr用于函数参数。
sockaddr_un
头文件
#include<netinet/in.h>
#include<arpa/inet.h>
sockaddr_un是一种UNIX套接字,通常在使用这种方式时不用网络套接字,而是用本地套接字
struct sockaddr_un
{
uint16_t sun_family;
char sun_path[108]; /* Path name. */
};
- 通讯类型只能选择 SOCK_STREAM 和 SOCK_DGRAM,协议为默认协议
- sun_family 参数只能选择AF_LOCAL和AF_UNIX
- sun_path 参数为本地文件路径,通常放在 /temp 目录下
示例代码
这是UDP网络程序编写的极小部分代码,用到了 socket 函数和 sockaddr_in 结构体,在后续文章完整编写 UdpServer 服务器时还会用到,这里先放出部分用于了解 如何使用 socket 和 sockaddr_in
// 创建网络套接字文件
_sockfd = socket(AF_INET, SOCK_DGRAM, 0); // 创建一个 使用IPV4 UDP链接 的网络套接字
// 指定网络信息
struct sockaddr_in local;
bzero((void *)&local, (size_t)sizeof local);
local.sin_family = AF_INET;
local.sin_port = htons(_port); // 将端口号从主机字节序转换为网络字节序
local.sin_addr.s_addr = inet_addr(default_ip.c_str()); // 将 string 的 ip 信息 转换为网络字节序