Java 网络原理 ①-IO多路复用 || 自定义协议 || XML || JSON

这里是Themberfue

在学习完简单的网络编程后,我们将更加深入网络的学习——HTTP协议、TCP协议、UDP协议、IP协议........... 


IO多路复用 

        ✨在上一节基于 TCP 协议 编写应用层代码时,我们通过一个线程处理连接的申请,随后通过多线程或者线程池来处理对每个客户端的请求;这样,一个客户端就对应一个线程。

        但随着客户端的数量不断增加,反复的创建和销毁线程,其开销都是很大的,哪怕是通过线程池处理,开销也是不容小觑的。

        ✨所以,为了解决这一问题,IO多路复用便诞生了:传统的IO操作是 阻塞式 的,当程序等待一个IO操作时,其他的IO操作会挂起,而 IO多路复用 允许程序同时监视多个 IO通道,从而不用为每个IO通道都单独地创建线程或进程。

        简单来说,就是一个线程就可以同时处理多个客户端的请求

        ✨举个例子:在大学生活中,给室友带饭是非常常见的的现象,假如你现在给两个室友带饭(总共买三份,你自己也得吃啊),你就要出去买三份晚餐,假设这三份晚餐都是在不一样的小吃摊贩卖的。

        这里的视角是,你是服务端,小吃摊老板是客户端,小吃摊老板做完后给你相当于给你发送请求,代入这个视角更好理解~~~

        第一种购买方案:你到了小吃摊A跟老板A说要一份晚餐,你等待老板A做完后,立刻去小吃摊B跟老板B说要一份晚餐,你等待老板B做完后,立刻去小吃摊C跟老板C说要一份晚餐,你等待老板C做完后;OK,此时全部请求处理完了。这里就相当于是单个线程处理完一个请求后立马处理下一个请求。

        第二种购买方案:你叫上其他两个认识的人(这里以甲乙丙代称),和你一起去买,到小吃摊A小吃摊A跟老板A说要一份晚餐,到小吃摊B跟老板B说要一份晚餐,到小吃摊C跟老板C说要一份晚餐;等到三份晚餐都做完后,全部请求也就处理完了。这里就相当于是创建了多个线程同时处理多个请求。

        第三种购买方案:依旧是你一个人买三份晚餐,但与第一种方案不同的是,你到了小吃摊A跟老板A说要一份晚餐,此时你立刻去小吃摊B跟老板B说要一份晚餐,随后又去吃摊C跟老板C说要一份晚餐;然后你就开始等他们做了,小吃摊A老板A做完后,你去拿,小吃摊B老板B做完后,你去拿,小吃摊C老板C做完后,你去拿;拿完全部之后,全部请求也就处理完了。这里就只用了一个线程就同时处理了多个请求。这便是 IO多路复用 的形象比喻

        ✨一般来说,绝大部分客户端,大部分时间都是沉默的,虽然连接了,但不会一直发送请求,此时工作线程等待就行了,等到客户端发来请求后,工作线程处理就OK了;很小的概率会说多个客户端同时发送请求的,这时候就灵活切换到线程池就可以了~~~

        ✨目前,IO多路复用 是服务器开发中主流的核心技术;不过这并不需要程序员自己实现,这是操作系统内置的,只需要调用API即可Java通过 NIO 封装了 IO多路复用


❤️以下是GPT-4o对 IO多路复用 的简单讲解:

IO 多路复用(I/O Multiplexing)

IO 多路复用是一种高效管理多个 IO 通信通道的技术,常用于需要同时处理多个网络连接或文件描述符的场景,比如高并发服务器的设计。它通过一种机制,让程序可以同时监听多个 IO 事件(如读、写、错误),并根据事件的发生进行相应处理。


1. 什么是 IO 多路复用?

传统的 IO 操作是 阻塞式 的,当程序等待一个 IO 操作完成时,其他的 IO 操作会被挂起。IO 多路复用允许程序同时监视多个 IO 通道,而不用为每个通道都创建独立的线程或进程。


2. 核心思想

IO 多路复用通过一个单独的线程或进程,利用系统调用 轮询事件通知 的方式,等待多个文件描述符上发生的事件,并在事件发生时通知应用程序处理。


3. 常见的 IO 多路复用机制

  1. select

    • 原理
      通过将一组文件描述符放入一个集合中,交给内核监听。内核阻塞直到其中一个文件描述符准备就绪。
    • 特点
      • 跨平台支持好。
      • 文件描述符数量有限制(通常是 1024)。
    • 缺点
      • 每次调用都需要重新设置监听集合。
      • 随着文件描述符增多,性能下降。
  2. poll

    • 原理
      类似于 select,但用链表代替固定大小的集合。
    • 特点
      • 无文件描述符数量限制。
      • 支持更大规模的并发连接。
    • 缺点
      • 仍需轮询文件描述符,性能会随描述符增多而下降。
  3. epoll

    • 原理
      提供事件驱动机制,支持 边缘触发水平触发 模式。
    • 特点
      • 只需注册一次文件描述符,后续只需监听。
      • 高效,适合高并发场景。
    • 优点
      • 内核维护了一个事件表,避免了重复传递描述符集合。
      • 边缘触发模式减少了无效通知。

4. IO 多路复用与传统模型的比较

模型描述优缺点
阻塞 IO程序阻塞直到 IO 完成。简单直观,但效率低。
非阻塞 IO程序不断轮询 IO 状态,直到操作完成。CPU 开销大,适用于短时间 IO 操作。
IO 多路复用一个线程监控多个文件描述符的 IO 状态,统一处理就绪事件。高效,适用于大量连接但 IO 操作较少的场景。
多线程/多进程 IO为每个连接创建线程/进程进行 IO 操作。简化编程模型,但线程/进程开销大,不适合高并发。
异步 IO操作提交后立即返回,由操作系统完成 IO,并通知程序。高效,但实现复杂,且操作系统支持有限。

5. IO 多路复用的应用场景

  1. 高并发网络服务器

    • 需要同时处理大量的客户端连接。
    • 示例:Web 服务器、聊天室、负载均衡器。
  2. 实时通信

    • 实时监控多个 IO 通道,快速响应。
    • 示例:即时聊天、视频直播。
  3. 文件监控和操作

    • 需要监听多个文件或套接字的状态。
    • 示例:日志实时监控工具。

6. IO 多路复用的优缺点

优点
  • 单线程即可管理多个 IO,减少线程上下文切换。
  • 提高了系统的吞吐能力,适合高并发场景。
  • 灵活,可根据不同的 IO 状态做不同处理。
缺点
  • 编程复杂度较高。
  • selectpoll 的性能在高连接数时会显著下降。
  • 对某些事件处理可能需要特殊优化。

7. epoll 的工作模式

  • 水平触发(LT, Level Triggered)
    文件描述符有事件发生时会不断通知应用程序,直到事件被处理完毕。
    特点:简单可靠,但可能导致重复通知。

  • 边缘触发(ET, Edge Triggered)
    文件描述符只有在事件发生的那一刻通知一次,之后不会重复通知。
    特点:高效,但要求应用程序及时处理数据。


总结

IO 多路复用是现代高并发服务器的基础,能够高效管理多个 IO 通道。在实际开发中,根据场景选择合适的多路复用机制(如 selectpollepoll),并结合具体业务需求和性能要求进行优化设计。


自定义协议 

        ✨作为程序员的我们一般都是工作在应用层的,应用层所涉及到的许多的网络通信协议大多都是程序员自己自定义的;这里的自定义的并不是说单独写一个新的协议,类似于 TCP、UDP、IP协议这种,当然了,我们也大概率没有那个能力。

        ✨这里的自定义协议通常规定客户端在请求时发送给服务器的特定数据,然后服务端根据这些数据进行解析,随后返回响应给客户端。

        ✨自定义协议通常指在网络通信中,为特定应用设计的一套规则,用于定义通信双方如何组织、传输和解释数据。通常情况下,程序员需要根据实际需求在应用层设计自定义协议,确保不同系统或设备之间能够正确通信。


如何自定义协议

        第一:需要明确需求,根据业务场景和逻辑进行自定义规则的编写,确定传输哪些数据。

        ✨第二:约定好数据的组织格式。

        ✨我们以点外卖为例子进行说明,进行点外卖前,我们肯定得先选择哪个店家,所以软件会显示出数家外卖店家;在显示出外卖店家前,还有一个步骤是用户看不到,那就是在点击进入店家浏览页面时,你作为客户端会立即向该软件的服务器发送一个请求;但不能单单地发送请求,这里就需要明确客户端发送哪些数据。

        比如:请求应该发送 客户的id、客户的位置、客户的经纬度、客户的偏好......,有了这些数据,服务器就会根据这些数据进行解析。

        服务器解析完后,就会给客户端返回一个响应,响应的数据可能包括:商家id、商家名称、商家图片、商家评分、商家热门商品、配送费用......

        在传输数据之前,如果没有一个约定好的格式对这些数据进行组织,这些数据就会乱套,导致数据解析发送错误,这便是第二步的 约定好数据的组织格式 的重要性。


组织数据的格式

纯文本

        数据以简单的字符串形式存储,每行或每部分以分隔符(如逗号、空格、换行符)区分。

# 请求数据
114514,江西省赣州市....,24N115E,螺狮粉\n

# 响应数据
1,商家名称1,商家图片1,商家评分1,商家热门商品1,配送费用\n
2,商家名称2,商家图片2,商家评分2,商家热门商品2,配送费用\n
3,商家名称3,商家图片3,商家评分3,商家热门商品3,配送费用\n
4,商家名称4,商家图片4,商家评分4,商家热门商品4,配送费用\n

        类似于上面的组织格式,以 ',' 来规定数据列之间的间隔,以' \n' 来规定数据行之间的间隔;当然,这里的格式纯属由程序员喜好自定义,这便是自定义的一步。

  • 优点

    1. 简单易懂,几乎不需要学习成本。
    2. 易于使用文本编辑器查看和修改。
    3. 对小型文件非常友好。
  • 缺点

    1. 缺乏结构化信息,难以表示复杂数据。
    2. 易出错,无法验证数据有效性。
    3. 没有标准化支持。
  • 适用场景:简单的日志记录、小型配置文件。


✨XML

        (eXtensible Markup Language)一种标记语言,使用标签组织层级化数据;类似于 HTML,但 HTML 的标签是规定好的,而 XML 则可以由程序员自定义。

<!-- 请求 -->
<request>
    <userId>114514</userId>
    <userPosition>江西省赣州市</userPosition>
    <transit>24N115E</transit>
    <favor>螺狮粉</favor>
</request>

<!-- 响应 -->
<response>
    <shop>
        <id>1</id>
        <nickName>商家名称1</nickName>
        <image>商家图片1</image>
        <rank>商家评分1</rank>
        <hotGoods>商家热门商品1</hotGoods>
        <sendPrice>配送费用</sendPrice>
    </shop>
</response>
  • 优点
    1. 可读性强
    2. 表示层次结构和复杂关系非常直观。
    3. 可扩展性强,可以自定义标签。
    4. 配备丰富的验证工具(如 DTD、XSD)。
  • 缺点
    1. 数据量大,冗余较多,影响传输效率。
    2. 人工编辑不直观,容易出错。
    3. 性能比 JSON 和二进制格式差。
    4. 传输带宽消耗大
  • 适用场景:早期的 Web 服务(SOAP)、配置文件、文档管理。

✨JSON

        JavaScript Object Notation)一种轻量级的数据交换格式,基于键值对。

{
    userId:114514,
    userPosition:江西省赣州市,
    transit:24N115E,
    favor:螺狮粉
}
  • 优点

    1. 简单易读,结构直观。
    2. 数据量较小,相比 XML 更适合网络传输。
    3. 被广泛支持,大多数语言都内置 JSON 解析库。
    4. 支持数组,易表示复杂数据结构。
  • 缺点

    1. 不支持注释,调试配置文件时不够灵活。
    2. 无内置数据类型定义(如数字的范围、枚举值等)。
    3. 在数据量特别大时,解析性能仍逊于二进制格式。
  • 适用场景:RESTful API、前后端数据交换、轻量级配置文件。


✨Protobuf

        (Protocol Buffers)Google 开发的一种高效的二进制序列化格式。

// 数据结构定义文件 .proto
message User {
    int32 id = 1;
    string position = "江西省赣州市";
    string transit = "24N115E";
    string favor = "螺狮粉";
}

// 对应的二进制序列化数据:
0A 05 41 6C 69 63 65 10 1E 1A 08 4E 65 77 20 59 6F 72 6B
  • 优点
    1. 序列化后数据体积小,性能高。
    2. 使用 .proto 文件强类型定义数据结构,防止数据错误。
    3. 向后兼容性好,可升级字段。
  • 缺点
    1. 可读性差,不适合直接查看和调试。
    2. 初学者需要学习其数据定义和生成工具的使用。
  • 适用场景:高性能分布式系统、大规模数据传输(如微服务之间通信)。

✨对比总结
特性纯文本XMLJSONProtobuf
可读性很高中等很低
结构化支持很强很强
效率(传输/解析)较低较低较高很高
文件体积较小很大较小很小
兼容性中等很高
使用场景简单场景配置和层次数据API 和交换数据高性能传输

选择数据格式的建议

  1. 小型项目或临时数据:使用纯文本或 JSON。
  2. 复杂结构的配置文件:可以使用 JSON 或 XML。
  3. 高性能需求或大规模系统:优先选择 Protobuf。
  4. 需要易读性和广泛兼容性:选择 JSON。
  5. 层次结构复杂且需要强校验:选择 XML。

不同场景选择合适的格式,能够显著提高项目的可维护性和效率。

 下节我们将进入著名的应用层协议——HTTP/HTTPS协议的讲解~~~

毕竟不知后事如何,且听下回分解 

❤️❤️❤️❤️❤️❤️❤️

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/944430.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

基于规则的系统架构:理论与实践

在当今信息化快速发展的时代&#xff0c;企业面临着日益复杂和多变的市场环境&#xff0c;传统的静态系统架构已难以满足快速响应业务变化的需求。基于规则的系统架构&#xff08;Rule-Based System Architecture, RBSA&#xff09;作为一种灵活、可扩展的架构模式&#xff0c;…

记一个itertools排列组合和列表随机排序的例子

朋友不知道哪里弄来了一长串单词列表&#xff0c;一定要搞个单词不重复的组合。那么这个时候我们就可以想到读书时所学的排列组合知识了&#xff0c;而这个在Python中可以怎么实现呢&#xff1f;我记录如下&#xff1a; 使用itertools模块实现排列组合 在 Python 中&#xff…

从0入门自主空中机器人-4-【PX4与Gazebo入门】

前言: 从上一篇的文章 从0入门自主空中机器人-3-【环境与常用软件安装】 | MGodmonkeyの世界 中我们的机载电脑已经安装了系统和常用的软件&#xff0c;这一篇文章中我们入门一下无人机常用的开源飞控PX4&#xff0c;以及ROS中无人机的仿真 1. PX4的安装 1.1 PX4固件代码的下载…

搭建vue项目

一、环境准备 1、安装node node官网&#xff1a;https://nodejs.org/zh-cn 1.1、打开官网&#xff0c;选择“下载”。 1.2、选择版本号&#xff0c;选择系统&#xff0c;根据需要自行选择&#xff0c;上面是命令安装方式&#xff0c;下载是下载安装包。 1.3、检查node安装…

深度学习笔记(5)——目标检测和图像分割

目标检测与图像分割 语义分割:如果没有语义信息,很难正确分类每个像素 解决方案:感知像素周围的语义,帮助正确分类像素 滑窗计算:计算非常低效,图像块的重叠部分会被重复计算很多次 解决方案:转向全卷积 全卷积问题:分类模型会大幅降低特征的分辨率,难以满足分割所需的高分辨…

go语言的成神之路-筑基篇-gin常用功能

第一节-gin参数绑定 目录 第一节-?gin参数绑定 ShouldBind简要概述 功能&#xff1a; 使用场景&#xff1a; 可能的错误&#xff1a; 实例代码 效果展示 第二节-gin文件上传 选择要上传的文件 选择要上传的文件。 效果展示? 代码部分 第三节-gin请求重定向 第…

【Leecode】Leecode刷题之路第93天之复原IP地址

题目出处 93-复原IP地址-题目描述 题目描述 个人解法 思路&#xff1a; todo代码示例&#xff1a;&#xff08;Java&#xff09; todo复杂度分析 todo官方解法 93-复原IP地址-官方解法 方法1&#xff1a;回溯 思路&#xff1a; 代码示例&#xff1a;&#xff08;Java&…

【新方法】通过清华镜像源加速 PyTorch GPU 2.5安装及 CUDA 版本选择指南

下面详细介绍所提到的两条命令&#xff0c;它们的作用及如何在你的 Python 环境中加速 PyTorch 等库的安装。 1. 设置清华镜像源 pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple这条命令的作用是将 pip &#xff08;Python 的包管理工具&#xf…

CES Asia 2025的低空经济展区有哪些亮点?

CES Asia 2025&#xff08;赛逸展&#xff09;的低空经济展区有以下亮点&#xff1a; • 前沿科技产品展示&#xff1a; 多款新型无人机将亮相&#xff0c;如固定翼无人机和系留无人机的最新型号&#xff0c;其在监测、救援和货物运输等方面功能强大。此外&#xff0c;还有可能…

python数据分析之爬虫基础:selenium详细讲解

目录 1、selenium介绍 2、selenium的作用&#xff1a; 3、配置浏览器驱动环境及selenium安装 4、selenium基本语法 4.1、selenium元素的定位 4.2、selenium元素的信息 4.3、selenium元素的交互 5、Phantomjs介绍 6、chrome handless模式 1、selenium介绍 &#xff08;1…

Python学生管理系统(MySQL)

上篇文章介绍的Python学生管理系统GUI有不少同学觉得不错来找博主要源码&#xff0c;也有同学提到老师要增加数据库管理数据的功能&#xff0c;本篇文章就来介绍下python操作数据库&#xff0c;同时也对上次分享的学生管理系统进行了改进了&#xff0c;增加了数据库&#xff0c…

二,Python常用库(共16个)

二&#xff0c;常用库(共15个 二&#xff0c;Python常用库(共15个)1&#xff0c;os模块2&#xff0c;json模块2.1 猴子补丁S 3&#xff0c;random模块4&#xff0c;string模块5&#xff0c;异常处理5.1 错误类型5.1 逻辑错误两种处理方式5.1.1 错误时可以预知的5.1.2 错误时不可…

Linux第99步_Linux之点亮LCD

主要学习如何在Linux开发板点亮屏&#xff0c;以及modetest命令的实现。 很多人踩坑&#xff0c;我也是一样。关键是踩坑后还是实现不了&#xff0c;这样的人确实很多&#xff0c;从群里可以知道。也许其他人没有遇到这个问题&#xff0c;我想是他运气好。 1、修改设备树 1)、…

解密MQTT协议:从QOS到消息传递的全方位解析

1、QoS介绍 1.1、QoS简介 使用MQTT协议的设备大部分都是运行在网络受限的环境下&#xff0c;而只依靠底层的TCP传输协议&#xff0c;并不 能完全保证消息的可靠到达。 MQTT提供了QoS机制&#xff0c;其核心是设计了多种消息交互机制来提供不同的服务质量&#xff0c;来满足…

网络安全 | 5G网络安全:未来无线通信的风险与对策

网络安全 | 5G网络安全&#xff1a;未来无线通信的风险与对策 一、前言二、5G 网络的技术特点2.1 超高速率与低延迟2.2 大容量连接与网络切片 三、5G 网络面临的安全风险3.1 网络架构安全风险3.2 设备终端安全风险3.3 应用场景安全风险3.4 用户隐私安全风险 四、5G 网络安全对策…

MyBatis知识点笔记

目录 mybatis mapper-locations的作用&#xff1f; mybatis configuration log-impl 作用&#xff1f; resultType和resultMap的区别&#xff1f; 参数 useGeneratedKeys &#xff0c;keyColumn&#xff0c;keyProperty作用和用法 取值方式#和$区别 动态标签有哪些 MyBat…

Midjourney技术浅析(二):文本预处理过程

Midjourney 的用户通过输入文本描述&#xff08;Prompts&#xff09;来生成高质量的图像。为了将用户输入的文本转化为机器可理解的格式&#xff0c;并提取其中的语义信息&#xff0c;Midjourney 依赖于强大的自然语言处理&#xff08;NLP&#xff09;预处理技术。 一、NLP 预…

考研互学互助系统|Java|SSM|VUE| 前后端分离

【技术栈】 1⃣️&#xff1a;架构: B/S、MVC 2⃣️&#xff1a;系统环境&#xff1a;Windowsh/Mac 3⃣️&#xff1a;开发环境&#xff1a;IDEA、JDK1.8、Maven、Mysql5.7 4⃣️&#xff1a;技术栈&#xff1a;Java、Mysql、SSM、Mybatis-Plus、VUE、jquery,html 5⃣️数据库…

ASP.NET Core Web API Hangfire

ASP.NET Core Web API Hangfire 前言一、安装二、相关代码1.代码片段2.代码片段3.运行效果 三、测试代码1.即发即弃作业2.延迟作业3.重复作业4.延续作业5.页面调度作业 前言 &#x1f468;‍&#x1f4bb;&#x1f468;‍&#x1f33e;&#x1f4dd;记录学习成果&#xff0c;以…

【Artificial Intelligence篇】AI 前沿探秘:开启智能学习的超维征程

目录 一、人工智能的蓬勃发展与智能学习的重要性: 二、数据的表示与处理 —— 智能学习的基石: 三、构建一个简单的感知机模型 —— 智能学习的初步探索: 四、神经网络 —— 开启超维征程的关键一步: 五、超维挑战与优化 —— 探索智能学习的深度: 六、可视化与交互 —— …