[oeasy]python0123_中文字符_文字编码_gb2312_激光照排技术_王选

中文编码GB2312

回忆上次内容

  • 上次回顾了 日韩各有 编码格式
    • 日本
      • 有假名
        • 五十音
        • 一字节 可以勉强放下
      • 有日本汉字
        • 字符数量超过20000+
    • 韩国
      • 有谚文
        • 数量超过500
        • 一个字节 放不下
      • 有朝鲜汉字
        • 字符数量超过20000+

图片描述

  • 作为 汉字源头的中国
    • 究竟应该 如何对汉字 进行编码 呢?🤔

汉字

  • 汉字起源于甲骨文
    • 是世界上唯一还在使用的象形文字
    • 真的很不容易

图片描述

  • 写的本意 就是 画
    • 写意
    • 写生
  • 这就是最初的
    • 象形字

六书

  • 以象形为基础
    • 指事
    • 会意
    • 形声
    • 转注
    • 假借

图片描述

  • 字的结构是什么呢?

间架结构

  • 上下
  • 左右
  • 内外

图片描述

  • 字型相当复杂
  • 笔画也千姿百态

汉字笔画

  • 笔画也比较复杂

图片描述

  • 运笔藏锋都很有讲究

中国大陆地区

  • 中国大陆地区最早使用 GB/T 2312-1980
    • 当时参考了比我们先进的日本JIS 字符集
    • 1980 年 指定的国标 (GuoBiao)
    • 1981 年 5 月 1 日开始使用

图片描述

  • GB2312 编码共收录汉字 6763 个
    • 其中一级汉字 3755 个
    • 二级汉字 3008 个
  • 这么多字怎么排呢?

区位

  • 01-09 区为特殊符号
    • 先把ascii的128个字符让出去
    • 然后在留有一些制表的字符
    • 还留了相当多的空余
  • 16-55 区为一级汉字
    • 按拼音排序
  • 56-87 区为二级汉字
    • 按部首/笔画排序

图片描述

  • 出了汉字之外,还收录了
    • 拉丁字母
    • 希腊字母
    • 日文平假名及片假名字母
    • 俄语西里尔字母
    • 真的很全了
  • 可是这gb2312
    • 具体是如何编解码的呢?🤔

应用

图片描述

  • 如果是0-127以内的ascii字符
    • 标志位为0
    • 1个字节存储

图片描述

  • 如果是ascii以外的字符
    • 标志位为1
    • 2个字节存储

编解码

  • 编解码方法一致就可以
    • 解铃还须系铃人

图片描述

  • 同时用 gb2312 编解码是没有问题的
  • 这篇 制定标准的文档
    • 当时怎么打印出来的呢?
    • 制定内码标准的 时候 就有 字形 了吗?

铅字

  • 虽然 计算机 在当时 还 没有普及
    • 但是 出版行业 已经 工业化 了

图片描述

  • 印刷厂 使用 铅活字 进行排版
    • 铸字工
    • 拼版工
    • 还有拣字工

拣字工

  • 印刷家谱 从 一个大盒子 就够了

图片描述

  • 字 再多些
    • 要用 转轮排字盘

图片描述

  • 字 再多些呢?

捡字室

  • 大 印刷厂
    • 字模 特别多

图片描述

  • 甚至 要放
    • 好 几面墙
    • 好 几张桌子

开端

  • 这 也 曾被
    • 使用26个字母的 西方文明 嘲讽

图片描述

  • 出书确实不易

    • 捡好了 字
    • 排好了 版
    • 先 打个样
    • 再来 校对
    • 再 浇铅板
    • 最后 印刷
  • 最初的

    • 书籍
    • 杂志
    • 报纸
    • 试卷
    • 都是这样 印刷出来 的
  • 到了 印刷 gb2312-80标准的 1980年

    • 已经启用了新的技术

机械打字机

  • 从 轮转排字盘
    • 到 谢卫楼 发明的 中文打字机

图片描述

  • 再到 舒震东
    • 在前人的研究基础上经过创新
    • 得到的 舒式打字机

图片描述

  • 中文字符 的数量
    • 是 一个难关
  • 直到
    • 照相技术 的 发展

照片排版

  • 使用 照片底片 进行排版

图片描述

  • 也面临检字的工作

图片描述

  • 照片排版技术本身也在迭代

激光照排

  • 这次使用 激光 扫描照片

图片描述

  • 每一个小字型都是一个照片
    • 根据汉字内码找到汉字对应的激光照片
    • 然后再把激光照片像活字一样排版
    • 这就是激光照排技术

图片描述

  • 用照片排版的方式

    • 制作了这样一个汉字编码的文档
  • 标准定了立刻就能用起来么?

过程

  • 凡事都有个过程
    • 95年定的gbk
    • 98年才逐渐推行开来
  • 但还是有些生僻字没有相应的字型

图片描述

  • 内码从无到有
    • 字形码也从无到有

图片描述

感谢前辈

  • 感谢王选与陈堃銶前辈的技艺

图片描述

  • 激光照排技术 可以
    • 印刷中文书籍 和 报纸 了

总结

  • 简体和繁体的汉字
    • 字符数量都超级大
    • 感谢王选和陈堃銶等前辈发明了激光照排技术
    • 中文排版从此使用上了gb2312编码

图片描述

  • 纸张之外
    • 显示器是更先进的输出设备
  • 计算机是如何在显示器上显示的呢?🤔
  • 我们下次再说!👋
  • 蓝桥->https://www.lanqiao.cn/courses/3584
  • github->https://github.com/overmind1980/oeasy-python-tutorial
  • gitee->https://gitee.com/overmind1980/oeasypython

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/7212.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

操作系统-AOSOA

一、个人感受 1.1 权衡 在我写这份报告的时候,已经是 6 月 30 号了,经历了一个学期的“折磨”,我面对终点,已经没啥感觉了,就想着赶快呼噜完了就完事了。其实做这个项目最大的体会就是“人力有穷,一切皆权…

视频剪辑:教你如何调整视频画面的大小。

大家应该都会调整图片的大小吧,那你们会调整视频画面的大小吗?我想,应该会有人不还不知道要调整的吧,今天就让小编来教大家一个方法怎样去调整视频画面的大小尺寸。 首先,我们要有以下材料: 一台电脑 【…

列的类型定义——整形类型

文章目录 前言一、整数类型的附带属性 类型名称后面的小括号unsignedauto_increment总结前言 1)采用26字母和0-9的自然数加上下互相 ‘_’ 组成,命名简洁明确,多个单词用下划线 ‘_’ 隔开 2)全部小写命名,尽量避免…

【SpringBoot】自定义Starter

🚩本文已收录至专栏:Spring家族学习之旅 👍希望您能有所收获 一.概述 在使用SpringBoot进行开发的时候,我们发现使用很多技术都是直接导入对应的starter,然后就实现了springboot整合对应技术,再加上一些简…

【论文导读】Inferring deterministic causal relations

前段时间看Scholkopf教授的《Towards Causal Representation Learning》,看到这篇挺有意思来读读。 这一篇只在Arxiv上挂着,重点主要是研究发掘两变量之间的因果关系(无法应用独立性检验等方法),引入了信息论中的正则…

Elasticsearch:配置选项

Elasticsearch 带有大量的设置和配置,甚至可能让专家工程师感到困惑。 尽管它使用约定优于配置范例并且大部分时间使用默认值,但在将应用程序投入生产之前自定义配置是必不可少的。 在这里,我们将介绍属于不同类别的一些属性,并讨…

2023年泰迪杯数据挖掘挑战赛B题--产品订单数据分析与需求预测(2.数据探索性分析)

前言 继续上一片数据预处理进行续写,利用预处理之后的数据进行数据分析并且解决问题一相关的问题。问题一主要目的是让研究各种因素对于需求量的影响,然后找到确定影响需求量的主要因素并且进行数据分析和主要特征抽取。 对于问题提出的八个小问&#…

解决云服务器ssh经常断开的问题

问题描述:无论是腾讯云服务器还是阿里云服务器等,在使用MobaXterm或者Xshell连接云服务器时,如果十分钟左右无任何操作,ssh就会自动断开,非常烦人,下面提供几种方法来解决该问题。 MobaXterm的报错如下&am…

Cookie和Session的工作流程及区别(附代码案例)

目录 一、 HTTP协议 1.1 为什么HTTP协议是无状态的? 1.2 在HTTP协议中流式传输和分块传输编码的区别 二、Cookie和Session 2.1 Cookie 2.2 Session 2.3 Cookie和Session的区别 三、servlet中与Cookie和Session相关的API 3.1 HttpServletRequest 类中的相关方…

mysql与redis区别

一、.redis和mysql的区别总结 (1)类型上 从类型上来说,mysql是关系型数据库,redis是缓存数据库 (2)作用上 mysql用于持久化的存储数据到硬盘,功能强大,但是速度较慢 redis用于存储使…

【新2023Q2押题JAVA】华为OD机试 - 挑选字符串

最近更新的博客 华为od 2023 | 什么是华为od,od 薪资待遇,od机试题清单华为OD机试真题大全,用 Python 解华为机试题 | 机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南华为od机试,独家整理 已参加机试人员的实战技巧本篇题解:挑选字符串 题目 给定a-z,…

二.microchip samE54-- ATSAME54P20A 开发板使用总结

板子图片 2.1 板子硬件资源 2.1.1 外部插件1 2.2.2 外部插件2 2.2.3 外部插件3 2.2.IDE KIT连接(USB DEBUG) 板子自带,不是JLINK 出现这个说明板载 调试软件识别成功 2.3 编译与下载 D:\HarmonyProjects\usart\usart_echo_blocking\f…

DataHub调研数据血缘

DataHub调研&数据血缘 1. DataHub? 阿里的数据工具datahub? 回答: 不是 DataHub是由Linkedin开源的,官方喊出的口号为:The Metadata Platform for the Modern Data Stack - 为现代数据栈而生的元数据平台。官方网站A Metadata Platfo…

Qt C++与Python混合编程:补充错误

在提示中,需要引用Python.h,出现错误。 1、找不到Python.h 如果是pro工程,需要在里面配置; INCLUDEPATH /Users/xinnianwang/opt/anaconda3/include LIBS /Users/xinnianwang/opt/anaconda3/lib 如果是CMakeLists.txt需要配…

【清明节】开发平台公司流辰信息缅怀先祖,传承精神,撸起袖子创佳绩!

四月暖春,草长莺飞,杨柳依依,大自然呈现出一片生机勃勃的朝气景象。中国传统民俗节日——清明节踏春而来,在回乡祭祖,缅怀先人的季节里,哀思、怀念、伤感已经成为整个清明节的主基调。在这万物复苏、春和景…

Spring循环依赖冤冤相报何时了

Spring循环依赖 🚎什么是循环依赖?那么循环依赖是个问题吗?单例setter, spring是如何解决的为什么需要三级缓存单单只有两级缓存行不行还得是你三级缓存三级缓存解决依赖循环全解梦想不会逃跑,会逃跑的永远都是自己 什么是循环依赖…

MySQL逻辑架构

讲师:尚硅谷-宋红康(江湖人称:康师傅) 官网:http://www.atguigu.com 1. 逻辑架构剖析 1.1 服务器处理客户端请求 首先MySQL是典型的C/S架构,即Client/Server 架构,服务器端程序使用的mysqld…

【2023】Kubernetes之Pod与容器状态关系

目录简单创建一个podPod运行阶段:容器运行阶段简单创建一个pod apiVersion: v1 kind: pod metadata: name: nginx-pod spec:containers:- name: nginximages: nginx:1.20以上代码表示创建一个名为nginx-pod的pod资源对象。 Pod运行阶段: Pod创建后&am…

vba:end属性

1.从录制一个宏开始。操作:(ctrl向上键、ctrl向下键、ctrl向左键、ctrl向右键) 2.看代码 Range.End 属性 返回一个 Range 对象,该对象代表包含源区域的区域尾端的单元格。 等同于按键 (End向上键、End向下键、End向左键、End向右键) 语法 表达式.End (…

Java基础(十四):包装类

Java基础系列文章 Java基础(一):语言概述 Java基础(二):原码、反码、补码及进制之间的运算 Java基础(三):数据类型与进制 Java基础(四):逻辑运算符和位运算符 Java基础(六):数组 Java基础(七):面向对…