AI大模型基石:文字与数字的起源与演变

AI大模型基石:文字与数字的起源与演变


1、文字

1.1、起源

  我们的祖先在还没有发明文字和语言之前就已经开始使用“咿咿呀呀”的声音来传播信息了,比如在野外活动遇到危险,然后发出“咿咿呀呀”的声音来提醒同伴小心,同伴在接收到信息后首先要做的就是解码,从“咿咿呀呀”中解读想要传递的信息。
  对发明并掌握文字的现代人来说,只是将祖先的“咿咿呀呀”替换成了象形文字和楔形文字,但是其本质都是为了传递信息。之所以会诱导我们的祖先发明文字,是因为其掌握的信息越来越多、语言越来越丰富和越来越抽象,人类大脑已经很难记住这么多的词汇,最终我们的祖先为了高效的记录信息,便走上发明文字的道路。
image.png
  约在公元前3400年左右,苏美尔人发展出了楔形文字,这是目前已知的最早的完整文字系统之一。楔形文字最初是以图画为基础,但很快就发展成为一种表意和表音的混合系统。这种文字系统在美索不达米亚地区(伊拉克境内)广泛使用,并由腓尼基人传播到其他地区。
  在甲骨文(公元前14世纪)出现的前约两千年(公元前24世纪左右),古埃及文明已开始使用图形表示事物,形成了最早的象形文字。无论是甲骨文还是古埃及的象形文字早期文字的数量都是和想要记录的信息相关,由于人类掌握的信息越来越多,象形文字就从刚开始的几百个,渐渐发展成几个千。此时的先祖们又一次站在的推动历史进程的拐点,开始了第一次对象形文字的归纳总结,从而就出现了一词多义的多义词、一词多音的多音词等等。
  高度概括又带来了难理解和歧义,不同的人接收到同一段文字可能会做出不同的解读。为了解决这样的问题就只能依靠上下文,其可以解决大多数歧义(除非估计捣乱)。我们阅读古籍看见的下面的标注,其实就是后人结合上下文按照自己理解进行去歧义的过程。

1.2、本质

  从文明古国文字起源不难看出都是因为随着对世界的认识越来越丰富,带来的信息也越来越多,原有记录信息和传播信息的方式已经不能满足当下需求不得不做出的演进。各文明古国在历史上相互隔绝,在没有交流沟通的前提下形成了不同的文字,但是其文字背后的本质都是为了记录所见所谓、所思所想的信息。
  我们把时间线拉到秦始皇统一六国之前春秋战国时期,在秦始皇还没有统一六国之前各国都有自己的文字和语言,各国之间商贸之所以能正常进行,正是因为在文字的本质是信息这个大前提下产生了翻译。当下翻译很常见,中英互翻和中法互翻等等,同样也没有逃过文字只是信息的载体,而非信息本身的底层本质。

2、数字

2.1、起源

  文字的出现是因为我们祖先掌握越来越多的信息导致大脑不能有效的记住这些信息,那么数字的出现也是因为我们祖先掌握的东西越来越多,只是这里的东西换成了财产。在远古时期我们的祖先拥有的财产可能就只有身上的几片树叶,根本没有到需要数一数的地步,所以就用不上数字,但是随着生产力的提高和部落的出现个人拥有的财产也随之增长,此时就到了需要数一数才能搞清楚自己有多少财产的时候了。
  正如一则小故事,两个部落首领要比一比谁说的数字大,A首领想了想说3,B首领因为家境贫寒想了半天没能想出比3大的数字,并说你赢了。由此数字的发明就是为了记录财产等需要数一数才能清楚有多少的东西。
  我们的祖先早期就是通过掰手指来数数,刚学加减法时候的我们也是如此,恰好人类双手有十根手指,便有了我们日常使用的十进制,如果人类手指不是十根,那么我们现在可能使用的就是其它进制的计数系统了。但是玛雅文明并没有使用十进制,而是将脚趾的十根也加了进来形成了二十进制,从而玛雅文明的计数法就和其他文明在本质上就有了区别,这可能也是玛雅文明如此神秘的原因之一吧。十多年前关于2012年世界末日的传说也是对玛雅文明技术系统的误解和夸大,玛雅人使用二十进制那么他们的日历系统也是基于二十进制的“长计数历”,并从公元前3114年8月11日玛雅文明的创世日期开始计算,正好到2012年12月21日为一个长计数历结束,所以这个日期只是表示一个周期结束和新周期的开始,而不是世界的终结。

2.2、发展

  约在35000年前人类就有了计数系统,但是所有古文明的计数系统在1、2、3的记录方式都是采用简单书写的几横(中国)、几竖(罗马)或者几点(美索不达米亚)。因为我们的祖先使用十进制的计算系统,那么在记录大数字的时候就又有编码的过程,如中国使用个十百千万亿兆来表示进位,罗马则使用相对复杂的系统来表示进位。
  同样是逢十进一中国使用十百千万亿兆来进行编码,然后使用乘法的规则进行解码,如一百万写法的含义就是110010000。而罗马使用“I代表1、V代表5、X代表10、L代表50、C代表100、D代表500、M代表1000”的系统来进行编码,然后使用加减法的规则进行解码(小数字出现在大数字左边为减、右边为加),如IV表示5-1=4,VI表示5+1=6,二者一比较高下立判。
  虽然中国和罗马在数字都有自己的独特发明,但是最高效的还是印度人发明由阿拉伯人传播包含0在内的10个阿拉伯数字,因为其便利性进而推过为全世界通用的数字计数系统。阿拉伯数字具有高度的抽象性,它很好的将文字和数字进行了分离,而不是像中国和罗马那么在文字上创造数字使得二者高度耦合。


一键三连,让我的信心像气球一样膨胀!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/528636.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

u-tabs徽标改颜色并随着鼠标点击而改色

在uview官网中没找到改色的api,然后就查看源码,发现通过修改源码能实现上图效果,本次组件用的uview 2x版本 修改文件u-tabs文件,然后把依赖文件带过来,如图下: 然后修改my_tabs.vue文件(即原u-…

一站式解读多模态——Transformer、Embedding、主流模型与通用任务实战(下)

本文章由飞桨星河社区开发者高宏伟贡献。高宏伟,飞桨开发者技术专家(PPDE),飞桨领航团团长,长期在自媒体领域分享AI技术知识,博客粉丝9w,飞桨星河社区ID为GoAI 。分享分为上下两期,本…

Windows下的ASLR保护机制详解及其绕过

写在前面: 本篇博客为本人原创,但非首发,首发在先知社区 原文链接: https://xz.aliyun.com/t/13924?time__1311mqmxnQ0%3DqGwx2DBqDTlpzeG%3DKT8qQTID&alichlgrefhttps%3A%2F%2Fxz.aliyun.com%2Fu%2F74789各位师傅有兴趣的…

设计模式总结-抽象工厂模式

抽象工厂模式 模式动机模式定义模式结构模式分析模式实例与解析实例一:电器工厂 模式动机 在工厂方法模式中具体工厂负责生产具体的产品,每一个具体工厂对应一种具体产品,工厂方法也具有唯一性,一般情况下,一个具体工…

4.8QT

将按钮3,基于qt4版本连接实现点击按钮3,实现关闭窗口。 widget.cpp #include "widget.h" #include "ui_widget.h"Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget), btn3(new QPushButton(this)) {ui->s…

D1084 5A低压差电压调整器应用方案,内含电流限制和热保护功能,防止任何过载时产生过高的结温。

1、 概述: D1084是一款具有5A输出能力、低压差为1.5V的三端稳压器。输出电压可通过电位器调节或1.5V, 1.8V, 3.3V三个固定电压版。内含电流限制和热保护功能,防止任何过载时产生过高的结温。D1084系列电路有标准TO-220、TO-263和TO-252封装形式。 2、 典…

代码随想录训练营day32

第八章 贪心算法 part02 1.LeetCode. 买卖股票的最佳时机II 1.1题目链接:122.买卖股票的最佳时机 II 文章讲解:代码随想录 视频讲解:B站卡哥视频 1.2思路:本题首先要清楚两点:只有一只股票!当前只有买股…

02_物联网感知技术

物联网感知技术 物联网感知技术 物联网感知技术

网络安全(防火墙,IDS,IPS概述)

问题一:什么是防火墙,IDS,IPS? 防火墙是对IP:port的访问进行限制,对访问端口进行制定的策略去允许开放的访问,将不放开的端口进行拒绝访问,从而达到充当防DDOS的设备。主要是拒绝网络流量,阻断所有不希望出现的流程,禁止数据流量流通,达到安全防护的作用。如将一些恶…

漫谈GIS和空间数据库技术

1 GIS和CAD有啥区别 地理信息系统(GIS)和计算机辅助设计(CAD)是两种不同的技术,它们在功能、应用和数据处理方面有着显著的区别。以下是根据搜索结果得出的GIS和CAD的主要区别: 1. **数据处理的侧重点不同…

Redis-底层数据结构

Redis-底层数据结构 redisObject对象机制对象共享引用计数以及对象的消毁 动态字符串SDS链表链表的优缺点: 压缩链表ziplist的缺点 字典-Dictrehash渐进式rehash 整数集-intSet内存分布图整数集合的升级 跳表 - ZSkipList快表-quicklistlistpack redisObject对象机制 typedef s…

【神经网络】生成对抗网络GAN

生成对抗网络GAN 欢迎访问Blog总目录! 文章目录 生成对抗网络GAN1.学习链接2.GAN结构2.1.生成模型Generator2.2.判别模型Discrimintor2.3.伪代码 3.优缺点3.1.优势3.2.缺点 4.pytorch GAN4.1.API4.2.GAN的搭建4.2.1.结果4.2.2.代码 4.3.示意图:star: 1.学习链接 …

浅析安全传输协议HTTPS之“S”

当前互联网,在各大浏览器厂商和CA厂商的推动下,掀起了一股HTTPS应用浪潮。为了让大家更好的了解HTTPS,本文给大家介绍关于HTTPS 中的S一个整体的认识。从其产生的历史背景、设计目标说起,到分析其协议设计结构、交互流程是如何实现…

kernel32.dll文件丢失的几种相应解决办法,成功解决丢失难题

当启动计算机并尝试运行某个应用程序时,屏幕上突然弹出一条醒目的错误提示:“电脑显示kernel32.dll丢失”。这也就意味着操作系统在当前环境下无法找到名为“kernel32.dll”的动态链接库文件。这个问题可能会导致一些应用程序无法正常运行,给…

【鸿蒙开发】系统组件Text,Span

Text组件 Text显示一段文本 接口: Text(content?: string | Resource) 参数: 参数名 参数类型 必填 参数描述 content string | Resource 否 文本内容。包含子组件Span时不生效,显示Span内容,并且此时text组件的样式不…

模型优化和调整(2)

接模型优化和调整(1) 调整反向传播 梯度消失和梯度爆炸 梯度消失和梯度爆炸都和计算出来的“delta”有关。理想的delta应该是逐渐减小的。如果delta一直太小,则会导致下降太慢,甚至对于权重没有改变,此时形成了梯度…

远程桌面无法连接怎么办?

远程桌面无法连接是指在尝试使用远程桌面功能时出现连接失败的情况。这种问题可能会给工作和生活带来极大的不便,因此我们需要寻找解决办法。在讨论解决方案之前,我们先来了解一下【天联】组网的优势。 【天联】组网的优势有很多。它能够解决复杂网络环境…

我自己开发的App上架了

我自己开发的App上架了 1、梦想实现 前几天,我在华为应用市场上架了我自己开发的App,心情十分激动。自从毕业后进入职场,在Android岗位上干了5年,一直想要开发一款App,为什么会有这种想法?一是能够按照自…

尝试在手机上运行google 最新开源的gpt模型 gemma

Gemma介绍 Gemma简介 Gemma是谷歌于2024年2月21日发布的一系列轻量级、最先进的开放语言模型,使用了与创建Gemini模型相同的研究和技术。由Google DeepMind和Google其他团队共同开发。 Gemma提供两种尺寸的模型权重:2B和7B。每种尺寸都带有经过预训练&a…

大话设计模式——18.策略模式(Strategy Pattern)

简介 是一系列算法的封装,即做的事情相同(方法名称相同)但是实现的方式不同,以相同方式调用所有的算法,减少算法与使用算法的耦合。直接调用方法。 UML图 应用场景 Java AWT中的LayoutManager(布局管理器&…