线程局部存储(TLS)

线程局部存储(Thread Local Storage,TLS),是一种变量的存储方法,这个变量在它所在的线程内是全局可访问的,但是不能被其他线程访问到,这样就保持了数据的线程独立性。而熟知的全局变量,是所有线程都可以访问的,这样就不可避免需要锁来控制,增加了控制成本和代码复杂度。

一、C/C++编程接口

POSIX线程库提供了如下API管理TLS:

// 创建一个TLS变量,并设置析构函数
int pthread_key_create(pthread_key_t *key, void (*destructor)(void*));
// 回收TLS变量,但是注意并不调用TLS的析构函数
int pthread_key_delete(pthread_key_t key);
// 获取TLS变量的当前值
void *pthread_getspecific(pthread_key_t key);
// 给TLS变量赋值
int pthread_setspecific(pthread_key_t key, const void *value);

除了上面API的方式,GCC的编译器也支持语言级别的用法,这样比用API调用,更简单。使用 __thread 关键字可将变量声明为线程局部变量,如下例所示:

__thread int i;
__thread char *p;
__thread struct state s;

使用GCC编译级别支持的方式来实现TLS的一个Demo:

// 编译:g++ main.cc -lpthread
#include<iostream>
#include<pthread.h>
#include<unistd.h>

using namespace std;
__thread int iVar = 100;

void* Thread1(void *arg)
{
    iVar += 200;
    cout<<"Thead1 Val : "<<iVar<<endl;
}

void* Thread2(void *arg)
{
    iVar += 400;
    sleep(1);
    cout<<"Thead2 Val : "<<iVar<<endl;
}

int main()
{
    pthread_t pid1, pid2;
    pthread_create(&pid1, NULL, Thread1, NULL);
    pthread_create(&pid2, NULL, Thread2, NULL);

    pthread_join(pid1, NULL);
    pthread_join(pid2, NULL);

    return 0;
}

在循环优化期间,编译器可根据需要选择创建临时线程局部变量。

适用性
__thread 关键字可以应用于任何全局变量、文件作用域静态变量或函数作用域静态变量。它对于始终是线程局部变量的自动变量没有影响。

初始化
在 C++ 中,如果初始化需要静态构造函数,将无法初始化线程局部变量。否则,可以将线程局部变量初始化为对于普通静态变量合法的任何值。无论是线程局部变量还是其他变量,都不能静态地初始化为线程局部变量的地址。

绑定
线程局部变量可以在外部声明和引用。线程局部变量遵循与普通符号相同的插入规则。

二、ELF中的TLS节

代码中所有的全局变量都存储在.data(静态初始化变量)和.bss(未静态初始化的变量)这两个段。而TLS变量存储位置有所不同:

  • 已初始化的线程局部变量分配在 .tdata.tdata1 节中,节类型为SHT_NOBITS,节属性为SHF_ALLOC + SHF_WRITE + SHF_TLS。此初始化可能需要重定位。
  • 未初始化的线程局部变量定义为 COMMON 符号,最终分配在 .tbss 节中进行,节类型为SHT_PROGBITS,节属性为SHF_ALLOC + SHF_WRITE + SHF_TLS

.data不一样的是,运行时程序不会直接访问这些TLS段。在分配了任何已初始化的节后会立即分配未初始化的节,并进行填充以便正确对齐(内存中.tbss紧跟在.tdata后)。

.tdata.tbss合并的节一起构成 TLS 模板,每次创建新线程时,都会使用此模板分配 TLS,所以每个线程启动时TLS都是相同的。此模板的已初始化部分称为 TLS 初始化映像。所有因已初始化的线程局部变量而生成的重定位将应用于此模板。当新线程需要初始值时,将使用重定位的值。

每个线程的TLS块都是运行时分配的,所以在链接时是不知道其地址的,要访问TLS变量必须借助动态链接器才能计算出其地址。链接时只能知道TLS变量在TLS段中的偏移。

TLS 符号的符号类型为 STT_TLS,这些符号表示相对于 TLS 模板开头的偏移量,而不是实际的虚拟地址。TLS 符号指向 TLS 模板的开头,而不是每个数据项的每个线程副本。在exec文件和共享目标文件中,对于已定义的 TLS 符号,其 st_value 字段包含指定的 TLS 偏移量,而对于未定义的 TLS 符号,此字段通常包含零。

访问 TLS 符号通常需要进行重定位,以便在运行时能够正确地计算 TLS 数据的地址。这些重定位引用 STT_TLS 类型的符号,并且还可以引用与 GOT 项关联的局部节符号。

对于根据 TLS 项进行的重定位,重定位地址在 TLS 模板的末尾编码为负偏移。计算该偏移时,首先将模板大小舍入到 32 位目标文件中最接近的 8 字节边界,然后舍入为 64 位目标文件中最接近的 16 字节边界。此舍入操作确保静态 TLS 模板合理对齐以便可用于任何用途。

在exec文件和共享目标文件中,PT_TLS 程序项用于描述 TLS 模板。此模板包含以下成员:

成员
p_offsetTLS 初始化映像的文件偏移
p_vaddrTLS 初始化映像的虚拟内存地址
p_paddr0
p_fileszTLS 初始化映像的大小
p_memszTLS 模板的总大小
p_flagsPF_R
p_alignTLS 模板的对齐方式

三、TLS运行时分配

在程序的生命周期中,会在三个时间创建 TLS。

  • 程序启动时。
  • 创建新线程时。
  • 程序启动后装入共享目标文件之后,线程第一次引用 TLS 块时。

3.1 TLS布局结构

运行时线程局部数据存储的布局如下图所示。

在这里插入图片描述

线程指针

每个线程 t 都有一个关联的线程指针 t p t tp_t tpt ,该指针指向线程控制块 TCB。线程指针 tp 始终包含当前正在运行的线程的 t p t tp_t tpt 值。

TLS模块偏移

动态链接器将exec文件装载之后,假设与exec文件相关联的动态库有多m个(再假设每个都有TLS模块),所以也就会有m + 1个模块(一个是exec的,假设其有)。动态链接器会将这些模块合并成单个静态模板,在合并的模板中,为每个动态目标文件(exec和共享库)的 TLS模板指定一个偏移 t l s o f f s e t m tlsoffset_m tlsoffsetm

t l s o f f s e t 1 = r o u n d ( t l s s i z e 1 , a l i g n 1 ) tlsoffset_1 = round(tlssize_1, align_1 ) tlsoffset1=round(tlssize1,align1)
t l s o f f s e t m + 1 = r o u n d ( t l s o f f s e t m + t l s s i z e m + 1 , a l i g n m + 1 ) tlsoffset_{m+1} = round(tlsoffset_m + tlssize{m+1}, align_{m+1}) tlsoffsetm+1=round(tlsoffsetm+tlssizem+1,alignm+1)

动态线程向量

动态线程向量(Dynamic Thread Vector,dtv)是在多线程程序中用于管理线程局部存储(TLS)的数据结构之一。每个线程都有一个 dtv,用于存储该线程的 TLS 变量的地址列表。dtv 是一个数组或指针数组,其中的每个元素都指向一个 TLS 变量的地址,这些地址通常相对于线程基址或线程指针(TP)进行偏移(可通过tp + tlsoffset进行访问)。

线程库为当前线程 t 创建一个指针向量 d t v t dtv_t dtvt。每个向量的第一个元素都包含一个生成编号 g e n t gen_t gent,该生成编号用于确定需要扩展向量的时间。 d t v t , m dtv_{t,m} dtvt,m 向量中剩余的每个元素都是一个指针,指向为属于动态目标文件 m 的 TLS的块的地址。

分配模型

有些模块的TLS块跟TCB放在一起,是程序启动时就分配 的(如exec及其依赖的.so),称为静态模型;有些模块是程序运行中动态加载的(通过dlopen()动态加载), TLS块在线程第一次访问时分配,称为动态模型

对于静态模型,在程序启动时动态链接器就可以确定其相对于 t p t tp_t tpt 的偏移值,如 t l s o f f s e t 1 、 t l s o f f s e t 2 、 t l s o f f s e t 3 tlsoffset_1、tlsoffset_2、tlsoffset_3 tlsoffset1tlsoffset2tlsoffset3,编译器生成代码时可以直接使用这些偏移值来访问。

对于动态模型,线程库将延迟分配 TLS 块。分配将在第一次引用已装入的目标文件中的 TLS 变量时进行,需要调用运行时系统提供的__tls_get_addr()获取其地址,如 t l s o f f s e t 4 、 t l s o f f s e t 5 tlsoffset_4、tlsoffset_5 tlsoffset4tlsoffset5

3.2 延迟分配TLS

对于延迟分配的TLS,由于其偏移值在启动时未知,必须借助于__tls_get_addr()获取,定义类似如下:

struct tls_index {
    size_t module_id;
    size_t offset;
};

void* __tls_get_addr(struct tls_index* ti)
{
    // Get the DTV of current thread.
    dtv_t* dtv = GET_CURRENT_DTV();

    // Check if the DTV is stale, and if so, update it.
    if (dtv[0].counter != dl_tls_generation) {
        update_dtv();
    }

    // Get the TLS block. If not allocated yet, allocate now.
    char* tls_block = dtv[ti->module_id];
    if (tls_block == UNALLOCATED_TLS_BLOCK) {
        tls_block = dtv[ti->module_id] = allocate_tls(module_id);
    }

    return tls_block + ti->offset;
}

module_id是模块ID,由动态链接器在加载模块时分配,从1开始(exec文件的模块ID固定是1)。

当动态加载或卸载一个模块时,动态链接器维护的dl_tls_generation会加1,表示模块信息有了变化。由于每个线 程的DTV时延迟更新的,所以每个线程的dtv[0]也会维护自己的generation counter,用于在访问TLS时判断 是否需要更新DTV。

四、TLS的访问模型

每个 TLS 引用都遵循下列访问模型之一。这些模型按照最常见、但最少优化到速度最快、但限制最大的顺序列出。要访问TLS变量需要确定两个信息:

  • 定义TLS变量的模块(可执行程序exec或动态共享库.so)。
  • TLS变量在该模块的TLS段的偏移。

4.1 常规动态 (General Dynamic, GD)-动态 TLS

此模型允许从共享目标文件或exec文件中引用所有 TLS 变量。如果是第一次从特定线程引用 TLS 块,此模型还支持延迟分配此块。

这种模式下不需要链接时知道模块ID和 偏移值。程序启动时动态链接器通过重定向确定模块ID和TLS变量的偏移值,存储在GOT表中。在访问TLS时调用 __tls_get_addr(),传入这两个参数,获取TLS变量的地址。

4.2 局部动态 (Local Dynamic, LD)-局部符号的动态 TLS

此模型是对 GD 模型的优化。编译器可能会确定变量在要生成的目标文件中是局部绑定或受到保护的。在这种情况下,编译器将指示链接器静态绑定动态的 tlsoffset 并使用此模型。与 GD 模型相比,此模型可提供更好的性能。每个函数只需要调用一次 tls_get_addr() 即可确定 d t v 0 , m dtv_{0,m} dtv0,m 的地址。进行链接编辑时绑定的动态 TLS 偏移会与每个引用的 d t v 0 , m dtv_{0,m} dtv0,m 地址相加。

如果链接器确定访问的TLS变量属于本模块(如文件作用域的TLS变量),则采用此模型。TLS变量的偏移值在链接时即可确定,只需要调用__tls_get_addr()确定TLS块的地址即可。由于TLS块的地址可以在不同的本地TLS变量访问时复用,所以相比于GD模型编译器可利用此模型生成有效的代码减少对__tls_get_addr()的调用次数。

4.3 初始可执行 (Initial exec文件utable, IE)-具有指定偏移的静态 TLS

此模型只能引用初始静态 TLS 中包含的 TLS 变量。此模板由进程启动时可用的所有 TLS 块和一个小的备份预留空间组成。在此模型中,给定变量 x 相对于线程指针的偏移存储在 x 的 GOT 项中。

此模型可以从初始进程启动后通过延迟装入、过滤器或 dlopen() 装入的共享库中引用有限数量的 TLS 变量。该访问可通过固定的备份预留空间来实现。此预留空间只能为未初始化的 TLS 数据项提供存储空间。为实现最大的灵活性,共享目标文件应使用动态的 TLS 模型引用线程局部变量。

如果可以确定访问的TLS变量在程序启动时就已分配好,则采用此模型。TLS变量相对于线程寄存器的偏移量可在程序启动时由动态链接器计算好存放在GOT表中。访问TLS变量相当于一次间接地址访问,不需要调用__tls_get_addr()

4.4 局部可执行 (Local exec文件utable, LE)-静态 TLS

此模型只能引用exec文件的 TLS 块中包含的 TLS 变量。链接器静态地计算相对于线程指针的偏移,而不需要进行动态重定位或额外引用 GOT。此模型不能用于引用exec文件外部的变量。

如果可以确定在exec文件中访问exec文件定义的TLS变量,则采用此模型。链接时即可知道TLS变量相对于线程寄存器的偏移量, 计算其地址相当于寄存器加上一个常量,因此访问TLS变量与访问局部变量没有区别。

4.5 模式转换

链接器可以将代码从更常规的访问模型转换为更优化的模型(如果确定适合进行转换)。这种转换可以使用独特的 TLS 重定位来实现。这些重定位不仅请求执行更新,还会标识要使用的 TLS 访问模型。

链接器在了解 TLS 访问模型和要创建的目标文件类型后,便可执行转换。例如,如果一个可重定位目标文件使用 GD 访问模型,被链接到一个exec文件中。在这种情况下,链接器可以适当地使用 IE 或 LE 访问模型转换引用。然后执行模型所需的重定位。

下图说明了不同的访问模型,以及从一个模型到另一个模型的转换。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/494644.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

班级综合测评管理系统的设计与实现|Springboot+ Mysql+Java+ B/S结构(可运行源码+数据库+设计文档)

本项目包含可运行源码数据库LW&#xff0c;文末可获取本项目的所有资料。 推荐阅读100套最新项目持续更新中..... 2024年计算机毕业论文&#xff08;设计&#xff09;学生选题参考合集推荐收藏&#xff08;包含Springboot、jsp、ssmvue等技术项目合集&#xff09; 目录 1. …

二十 超级数据查看器 讲解稿 功能概述

二十 超级数据查看器 讲解稿 功能概述 ​ ​​点击此处 以新页面 打开B站 播放当前教学视频 点击访问app下载页面 豌豆荚 下载地址​ ​ 讲解稿 ​ 界面启动 ​ 导入 ​ 选excel文件 导入 ​ 原来的excel文件 ​ 导入进本地数据库sqlite ​ 导入成功 ​ 列…

MySQL---事务

目录 一、事务简介 二、事务操作 1.未控制事务 2.事务控制一 3.控制事务二 三、事务的四大特性 四、并发事务问题 五、事务隔离级别 一、事务简介 事务 是一组操作的集合&#xff0c;它是一个不可分割的工作单位&#xff0c;事务会把所有的操作作为一个整体一起向系统提交或…

喜讯!聚铭网络荣获《日志分类方法及系统》发明专利

近日&#xff0c;聚铭网络又喜获一项殊荣&#xff0c;其申报的《日志分类方法及系统》发明专利成功获得国家知识产权局的授权&#xff0c;正式荣获国家发明专利证书。 在信息化时代&#xff0c;网络安全问题日益凸显&#xff0c;日志分析作为保障网络安全的重要手段&#xff…

【嵌入式——C语言】VScode编写C程序、交叉编译

【嵌入式——C语言】VScode编写C程序、交叉编译 第一步第二步第三步第四步第五步第六步第七步第八步 第一步 下载Visual Studio Code下载地址 然后直接安装就可以了。 第二步 前提是你的电脑上安装了WSL。。。 打开vscode的扩展&#xff0c;输入WSL进行安装 安装完之后在窗…

【深度学习】图片预处理,分辨出模糊图片

ref:https://pyimagesearch.com/2015/09/07/blur-detection-with-opencv/ 论文 ref:https://www.cse.cuhk.edu.hk/leojia/all_final_papers/blur_detect_cvpr08.pdf 遇到模糊的图片&#xff0c;还要处理一下&#xff0c;把它挑出来&#xff0c;要么修复&#xff0c;要么弃用。否…

vue组件如何使用?

今天我随便试两个组件 第一个轮播图 在minn.js 引入 import { createApp } from vue; import { Swipe, SwipeItem } from vant; const app createApp(); app.use(Swipe); app.use(SwipeItem); <van-swipe class"my-swipe" :autoplay"3000" indica…

uniapp 微信小程序 canvas 手写板文字重复倾斜水印

核心逻辑 先将坐标系中心点通过ctx.translate(canvasw / 2, canvash / 2) 平移到canvas 中心&#xff0c;再旋转设置水印 假如不 translate 直接旋转&#xff0c;则此时的旋转中心为左上角原点&#xff0c;此时旋转示意如图所示 当translate到中心点之后再旋转&#xff0c;此…

逐步学习Go-协程goroutine

参考&#xff1a;逐步学习Go-协程goroutine – FOF编程网 什么是线程&#xff1f; 简单来说线程就是现代操作系统使用CPU的基本单元。线程基本包括了线程ID&#xff0c;程序计数器&#xff0c;寄存器和线程栈。线程共享进程的代码区&#xff0c;数据区和操作系统的资源。 线…

每日一题--- 环形链表[力扣][Go]

环形链表 题目&#xff1a;142. 环形链表 II 给定一个链表的头节点 head &#xff0c;返回链表开始入环的第一个节点。 如果链表无环&#xff0c;则返回 null。 如果链表中有某个节点&#xff0c;可以通过连续跟踪 next 指针再次到达&#xff0c;则链表中存在环。 为了表示给…

数字身份的革命:解锁 Web3 的身份验证技术

引言 随着数字化时代的到来&#xff0c;个人身份认证成为了日常生活和商业活动中不可或缺的一部分。传统的身份验证方式存在着安全性低、易伪造、不便利等问题&#xff0c;因此&#xff0c;人们迫切需要一种更安全、更便捷的身份验证技术。在这样的背景下&#xff0c;Web3的身…

数仓建设实践——58用户画像数仓建设

目录 一、数据仓库&用户画像简介 1.1 数据仓库简介 1.2 数据仓库的价值 1.3 用户画像简介 1.4 用户画像—标签体系 二、用户画像数仓建设过程 2.1 画像数仓—背景&现状 2.2 画像数仓—整体架构 2.3 画像数仓—研发流程 2.4 画像数仓—指标定义 2.5 画像数仓…

Java基本数据结构(基于jdk11)

java中有很多数据类型&#xff0c;以下数据类型都出于java.util包下且日常经常使用的&#xff0c;先介绍一下接口&#xff0c;接口可以很快的了解到这个数据结构的特性。 接口 List: 有序队列&#xff0c;如&#xff1a;ArrayList、LinkedList Deque&#xff1a;双端队列&am…

视图的作用

目录 视图的作用 创建视图 为 scott 分配创建视图的权限 查询视图 复杂视图的创建 视图更新的限制问题 更新视图中数据的部门编号&#xff08;视图的存在条件&#xff09; 限制通过视图修改数据表内容 创建只读的视图 复杂视图创建 oracle从入门到总裁:​​​​​​h…

Android 性能优化(六):启动优化的详细流程

书接上文&#xff0c;Android 性能优化&#xff08;一&#xff09;&#xff1a;闪退、卡顿、耗电、APK 从用户体验角度有四个性能优化方向&#xff1a; 追求稳定&#xff0c;防止崩溃追求流畅&#xff0c;防止卡顿追求续航&#xff0c;防止耗损追求精简&#xff0c;防止臃肿 …

【研发日记】Matlab/Simulink开箱报告(十)——Signal Routing模块模块

文章目录 前言 Signal Routing模块 虚拟模块和虚拟信号 Mux和Demux Vector Concatenate和Selector Bus Creator和Bus Selector 分析和应用 总结 前言 见《开箱报告&#xff0c;Simulink Toolbox库模块使用指南&#xff08;五&#xff09;——S-Fuction模块(C MEX S-Fun…

SQLite中的动态内存分配(五)

返回&#xff1a;SQLite—系列文章目录 上一篇&#xff1a;SQLite中的原子提交&#xff08;四&#xff09; 下一篇&#xff1a;SQLite使用的临时文件&#xff08;二&#xff09; ​概述 SQLite使用动态内存分配来获得 用于存储各种对象的内存 &#xff08;例如&#xff1a…

android 11 SystemUI 状态栏打开之后的界面层级关系说明之一

比如WiFi 图标的父layout为&#xff1a; Class Name: ButtonRelativeLayout Class Name: QSTileView Class Name: TilePage Class Name: PagedTileLayout Class Name: QSPanel Class Name: NonInterceptingScrollView Class Name: QSContainerImpl Class Name: FrameLayout Cl…

2018年亚马逊云科技推出基于Arm的定制芯片实例

2018年&#xff0c;亚马逊云技术推出了基于Arm的定制芯片。 据相关数据显示&#xff0c;基于Arm的性价比比基于x86的同类实例高出40%。 这打破了对 x86 的依赖&#xff0c;开创了架构的新时代&#xff0c;现在能够支持多种配置的密集计算任务。 这些举措为亚马逊云技术的其他创…

计算机票.java

题目&#xff1a;机票价格按照淡季旺季&#xff0c;头等舱和经济舱收费&#xff0c;输入机票原价&#xff0c;月份&#xff0c;头等舱或经济舱 。按照如下规则计算机票价格&#xff1a;旺季&#xff08;5-10月&#xff09;头等舱九折&#xff0c;经济舱8.5折&#xff0c;淡季&a…