汇编语言(机器语言)的执行过程
汇编语言的本质:机器语言的助记符 其实他就是机器语言
计算机通电->CPU读取内存中程序(电信号输入)
->时钟发生器不断震荡通电 ->推动CPU内部一步一步执行(执行多少步取决于指令需要的时钟周期)
->计算完成 ->写回(电信号)->写给显卡输出(打印或者图形)
CPU的基本组成
PC-> Program Counter 程序计数器 (记录当前指令地址)
Registers -> 暂时存储CPU计算需要用到的数据 (记存器)
ALU -> Arithmetic & Logic Unit 运算单元
CU -> Control Unit 控制单元
MMU -> Memory Management Unit 内存管理单元
缓存
缓存行:
缓存行越大,局部性空间效率越高,但读取时间慢
缓存行越小,局部性空间效率越低,但读取时间快
取一个折值,目前多用:64字节
缓存行对齐:对于有些特别敏感的数字,会存在线程高竞争的访问,为了保证不发生伪共享,可以使用缓存行对齐的编程方式
JDK7中,很多采用long padding提高效率
JDK8,加入了@Contened注解(实验)需要加上:-JVM -XX:-RestrictContended
乱序执行
CPU层面如何禁止重排序?
答:内存屏障 (对某部分内存做操作时前后添加的屏障,屏障前后的操作不可以乱序执行)
禁止乱序
cpu层面:inter ->原语(mfence ifence sfence)或者锁总线
jvm层级:8个hanppens-before原则,4个内存屏障 (LL LS SL SS)
as-if-serial:不管硬件什么顺序,单线程执行的结果不变,看上去像是serial
volatile的实现细节
JVM层面:
StoreStorBarier volatile写操作 StoreLoadBarrier
LoadLoadBarrier volatile读操作 LoadStoreBarrier
合并写 (不重要)
Write Combining Buffer
一般是四个字节
由于ALU速度太快,所以在写入L1的同时,写入一个WC Buffer,满了之后,再直接更新到L2
NUMN
Non Uniform Memory Access
ZGC- NUMA aware
分配内存会优先分配该线程所在CPU的最近内存,可以显著提高效率,也可以访问其他内存,只不过效率较慢
启动过程(不重要)
通电-> bios uefi 工作 ->自检 -> 到硬盘固定位置加载bootloder -> 读取可配置信息 -> CMOS
OS基础
内核分类
微内核 - 弹性部署 5G loT
宏内核 - PC phone
外核 - 科研 实验中 为应用定制操作系统(多租户 request-basedGC JVM)
用户态与内核态
cpu分不同的指令级别
linux内核跑在ring 0级,用户程序跑在ring3,对于系统的关键访问,需要经过kernel的同意,保证系统健壮性
内核执行的操作 -> 200多个系统调用 sendfile read write pthread fork
JVM -> 站在OS的角度,就是一个普通程序
进程 线程 纤程 中断
面试高频:进程和线程有什么区别?
答案:进程就是一个程序运行起来的状态,线程是一个进程中的不同的执行路径。
专业回答:进程是OS分配资源的基本单位,线程是执行调度的基本单位。分配资源最重要的是:独立的内存空间,线程调度执行(线程共享进程的内存空间,没有独立的内存空间)
纤程:用户态的线程,线程中的线程,切换和调度不需要经过OS
优势:
- 占有资源很少OS:线程1M Fiber :4K
- 切换比较简单
- 启动很多个10w+
目前2020 3 22支持内置纤程的语言:Kotin Scala GO Python(lib)... Java?(open jdk:loom)
Java中对于纤程的支持:没有内置,盼望内置
利用Quaser库 (不成熟)
纤程的应用场景
纤程 VS 线程池 :很短的计算任务,不需要和内核打交道,并发量高
进程
linux中也称为task,是系统分配资源的基本单位
资源:独立的地址空间 内核数据结构 (进程描述符...)全局变量 数据段...
进程描述符: PCB (Process Control Block)
什么是僵尸线程
ps-ef | grep defuct 父进程产生子进程后,会维护进程的一个PCB结构,子进程退出,由父进程释放,如果父进程没有释放,那么子进程成为一个僵尸进程
什么是孤儿线程
子进程结束之前,父进程已经退出,孤儿进程会成init进程的孩子,由1号进程维护 orphan.c
进程调度
2.6采用CFS调度策略:Completely Fair Scheduler
按优先级分配时间片的比例,记录每个进程的执行时间,如果有一个进程执行时间不到他应该分配的比例,优先执行
默认调度策略:
实时进程:(急诊)优先级分高低 - FIFO (First In First Out),优先级一样 - RR(Round Robin)
普通进程:CFS
中断
硬件跟操作系统内核打交道的一种机制
软中断(80中断)== 系统调用
系统调用: int 0x80 或者 sysenter原语通过ax寄存器填入调用号
参数通过bx cx dx si di传入内核返回值通过ax返回
java读网络 - jvm read() - c库read() - >内核空间 -> system_call() (系统带哦有处理程序) -> sys_read()
内存管理
内存管理的发展历程
DOS时代 - 同一时间只能有一个进程在运行(也有一些特殊算法可以支持多线程)
windows9x - 多个进程装入内存 (问题)1:内存不够用 2:互相打扰
为了解决这两个问题,诞生了现在的内存管理系统:虚拟地址 分页装入 软硬件结合寻址
1.分页,内存中分成固定大小的页框(4k),把程序(硬盘上)分成4K大小的块,用到哪一块,加载哪一块,加载的过程中,如果内存已经满了,会把最不常用的一块分区放到swap分区,把最新的一块加载进来,这个就是著名的LRU算法 (力扣146题)
2.虚拟内存(解决相互打扰问题)
- DOS Win31 ...
- 为了保证互不影响 - 让进程工作在虚拟空间,程序中用到的空间地址不再是直接的物理地 址,而是虚拟的地址,这样,A进程永远不可能访问到B进程的空间
- 虚拟空间多大呢?寻址空间 - 64位置 2^64,比物理空间大很多,单位是byte
- 站在虚拟的角度,进程是独享整个系统 + CPU
- 内存映射:偏移量 + 段的基地址 = 线性地址 (虚拟空间)
- 线性地址通过OS + MMU (硬件 Memory Management Unit)
3.缺页中断
1.需要用到页面内存中没有,产生缺页异常(中断),由内核处理并加载
为什么使用虚拟内存?
•隔离应用程序
-每个程序都认为自己有连续可用的内存
-突破物理内存限制
-应用程序不需要考虑物理内存是否够用,是否能够分配等底层问题
•安全
-保护物理内存,不被恶意程序访问
ZGC
算法叫做 : Colored Pointer
GC信息记录在指针是,不是记录在头部,immediate memory use
42位指针 寻址空间4T JDK13 -> 16T 目前为止最大16T (2^44)
CPU如何区分一个立即数和一条指令
总线内部分为:数据总线 地址总线 控制总线
地址总线目前:48位
内核同步机制
关于同步理论的一些基本概念
- 临界区(critical area):访问或操作共享数据的代码段。简单理解:synchronized大括号中部分(原子性)
- 竞争条件(race conditions)两个线程同时拥有临界区的执行权
- 数据不一致:data unconsistency 由竞争条件引起的数据破坏
- 同步(synchronization)避免race conditions
- 锁:完成同步的手段(门锁,门后是临界区,只允许一个线程存在)
- 上锁解锁必须具备原子性
- 原子性(象原子一样不可分割的操作)
- 有序性(禁止指令重排)
- 可见性(一个线程内的修改,另一个线程可见)
- 互斥锁,排它锁,共享锁,分他锁
内核同步常用方法
- 原子操作-内核中类似于AtomicXXX,位于<linux/types.h>
- 自旋锁-内核中通过汇编支持的cas,位于<asm/spinlock.h>
- 读-写自旋-类似于ReadWriteLock,可同时读,只能一个写读的时候是共享锁,写的时候是排他锁
- 信号量-类似于Semaphore(PV操作 down up操作 占有和释放)重量级锁,线程会进入wait,适合长时间持有的锁情况
- 读-写信号量-downread upread downwrite upwrite(多个写,可以分段写,比较少用)(分段锁)
- 互斥体(mutex)-特殊的信号量(二值信号量)
- 完成变量-特殊的信号量(A发出信号给B,B等待在完成变量上。vfork()在子进程结束时通过完成变量叫醒父进程 类似于(Latch)
- BKL:大内核锁(早期,现在已经不用)
- 顺序销(26) 一线程可以挂起的迹写自旋锁序列计数器(从0开始,写时增加(+1),写完释放(+1),读前发现单数,说明有写线程,等待,读前读后序列一样,说明没有写线程打断)
- 禁止抢占-preempt disable)
- 内存屏障-见volatile