摘要
双语经验的神经印记对于理解大脑如何处理优势语言和非优势语言至关重要,但关于它的研究仍然没有定论。不同的研究表明神经处理存在相似性或差异性,这对患有脑肿瘤的双语患者具有重要意义。保留术后的双语功能需要考虑到术前的神经可塑性变化。在这里,本研究结合了单变量和多变量fMRI方法来测试一组健康的西班牙-巴斯克双语者和一组受语言优势半球影响的胶质瘤双语患者,同时让他们使用优势或非优势语言进行口头表达。健康参与者的研究结果揭示了两种语言存在一个共享的神经系统,同时也识别了具有不同语言依赖性激活和偏侧化模式的区域。具体而言,优势语言激活了更偏向左侧的网络,而非优势语言的言语生成则依赖于双侧基底神经节-丘脑-皮层回路的激活。值得注意的是,基于语言偏侧化模式,我们能够稳健地解码所使用的语言(AUC:0.80±0.18)。相比之下,双语患者在两种语言中均表现出双侧激活模式。在优势语言中,小脑、丘脑和尾状核等区域与稀疏激活的语言特异性节点协同作用。而在非优势语言的情况下,默认模式网络的激活尤为显著。这些结果表明,即使在病理条件下,非语言特异性网络在维持双语言语生成中也会发挥补偿性作用。总体而言,本研究结果强调了双语经验对大脑功能(再)组织的广泛影响,无论是在健康状态还是在病理状态下。
引言
言语生成是一项看似轻松的技能,但实际上涉及一套复杂的层次化认知过程。这些过程包括概念的检索与选择、句法、形态和语音信息的检索、后词汇阶段的发音规划,以及自我监控和语言控制机制。神经成像研究已经确定了一些在健康个体中负责这些功能的关键神经结构,例如额下回(IFG)、颞上回(STG)和边缘上回(SMG),以及控制感觉与运动表征之间映射的小脑、初级运动皮层和躯体感觉皮层,它们对语言功能至关重要。尽管对单语者的研究十分广泛,但关于双语者言语生成的神经结构研究仍然有限。本研究旨在通过调查与双语言语产生相关的神经网络来填补这一知识空白,从而为双语患者的语言恢复提供潜在的见解。
不同的研究对健康双语者在使用两种语言时的表现所得到的结论并不相同。一些研究显示了语言之间的特异性,而另一些则揭示了重叠的神经基质。为了阐明这一矛盾的情况,有研究进行了系统性回顾,总结了与双语相关的功能和结构神经可塑性发现。得出的结论是,双语经验对大脑在领域一般控制区域的活动有影响。这些区域包括右侧尾状核、前扣带回、左侧顶叶和双侧小脑。然而,一些fMRI研究也揭示了语言特异性区域的功能变化,包括左侧STG、左侧SMG、梭状回和IFG。尽管有证据表明存在共享的神经基质,但仍不确定双语言经验是否会影响一般的非语言特定机制或塑造语言特定的神经结构。
随着面临神经系统疾病风险的双语人群数量增加,理解双语大脑变得更加重要。语言网络的损伤(脑肿瘤)会对个体的生活质量产生重大影响,并影响他们所使用的一种或两种语言。关于这一问题的统计数据令人震惊:根据世界卫生组织的数据,每年大约有30万人受到中枢神经系统肿瘤的影响,其中许多人具有使用多种语言的语言特征。考虑到这一点,医疗中心已将术前语言映射协议纳入临床常规,并将fMRI与简单的语言生成任务相结合。这种无创技术提供了有关语言网络结构和功能偏侧化的宝贵信息,使神经外科医生能够设计个性化的干预方案,以最大限度地降低术后神经后遗症的风险。
然而,目前尚未建立和验证双语大脑的术前语言映射方案。大多数关于脑肿瘤患者术前映射的研究都是在患者接受治疗的国家官方语言环境下进行的,而不考虑患者的优势语言或他们所使用的其他语言。为此,本研究开发并验证了一项名为MULTIMAP的图片命名任务,并针对十种不同语言进行了标准化,同时控制了诸如名称一致性、频率、长度和替代邻词等语言测量指标。该任务最小化了语言对之间的语言距离,从而允许在脑肿瘤患者中进行多语种的术前和术中映射。
本研究基于MULTIMAP图片创建了一项fMRI句子完成任务。该任务用于测量健康的西班牙-巴斯克双语者和双语脑肿瘤患者在使用其优势语言或非优势语言时的大脑活动。本研究的测量目标包含两个方面。首先,本研究旨在探索健康双语者的两种语言在区域激活和偏侧化模式方面是否参与相似或不同的神经网络。通过分析这一点,我们可以获得有关双语言语产生的神经生物学见解,并提供常模数据以更好地了解患者潜在的神经可塑性变化。其次,本研究利用相同的任务来考察由影响语言优势半球的脑肿瘤所引发的神经可塑性补偿机制如何对双语患者的优势语言和非优势语言产生不同影响。
材料和方法
健康样本
健康对照组由20名西班牙-巴斯克语熟练的双语者组成(12名女性),年龄范围为19-36岁(平均年龄=25.25,标准差=5.76)。
所有参与者均为右利手,视力正常或矫正至正常,且无精神疾病、神经疾病或学习障碍病史。巴斯克人的语言特征非常独特,因为所有个体从很早的阶段就接触西班牙语和巴斯克语,无论他们首先学习哪种语言。这种情况为研究社会语言丰富性对大脑结构的影响提供了机会。巴斯克语和西班牙语的主导性、使用频率和接触程度与居住地点密切相关。然而,根据巴斯克政府最新进行的社会语言学调查结果,16岁以上的人口中有51.8%以巴斯克语为主,并熟练掌握了西班牙语,其中28.3%被认定为同时双语者。相反,有17.7%的人口以西班牙语为主,虽然对巴斯克语有一定了解,但主要是在理解方面而非表达方面。此外,还有30.5%以西班牙语为主,并且不懂巴斯克语。
本研究挑选了一组双语者样本,并遵循严格的纳入标准。这些标准包括:(1)在3岁前学会西班牙语和巴斯克语;(2)在BEST半结构式访谈中,两种语言的熟练程度均超过4分(范围为1-5分,5分表示最高熟练度);(3)两种语言的使用比例相似(大约各占40%)。此外,本研究对其他语言的接触和习得进行了控制。虽然所有参与者在英语方面都有一定的熟练度(使用10分制的自我评估量表,对听、说、读、写的平均评分为6.69,标准差为1.13),但与其他两种语言相比,英语的使用程度较低(习得年龄=5.35,标准差=3.07;每日接触时间=11.76%,标准差=8.09)。
使用巴斯克语、英语和西班牙语的图片命名标准化测试(BEST),以及简短的半结构式访谈(由经验丰富的语言学家对每名参与者的两种语言技能进行1-5级评分)来评估语言熟练度。只有在访谈中评分达到4分或5分的参与者才会被纳入分析。本研究还收集了他们每天接触这两种语言的数据,并要求他们使用10点量表对西班牙语和巴斯克语的听、说、读、写水平进行自我评估。将这些评分取平均值,得到自评评分。最后,参与者完成了西班牙语和巴斯克语版本的LexTALE,这是一个简短的词汇决策测试,已被证明可以很好地评估语言能力。每种语言的评分以及MULTIMAP的行为结果见表1。需要注意的是,两种语言之间的任何变量都没有显著差异。确定同时双语者的优势语言本身就很复杂。然而,基于在评估时西班牙语的接触和使用程度明显高于巴斯克语,本研究将西班牙语视为这些个体的主要语言。因此,本文使用“优势语言”一词来指代西班牙语,用“非优势语言”指代巴斯克语。
表1.健康参与者的语言评估分数。
临床人群
10名患有低级别胶质瘤(LGG)的西班牙语-巴斯克语双语患者参与了这项研究。这种类型的原发性神经系统肿瘤发展缓慢,增强了结构和功能上的神经可塑性,并导致认知症状的出现延迟。因此,LGG患者构成了一个理想的病理模型,用于研究与大脑网络主要结构改变相关的神经可塑性。
这些患者接受了诊断并进行了脑部手术以切除肿瘤,同时进行了术中皮层和皮下直接刺激以确定功能边界。医院的初步神经检查显示未发现运动、躯体感觉或语言缺陷。他们的听力正常,视力正常或经过矫正后正常。表2总结了患者的人口统计学和临床特征(图1获取病灶的3D重建)。本研究中的数据是其术前检查的一部分。
表2.人口统计学特征。
图1.10例双语患者的3D病灶重建。
用于表征语言网络的双语句子完成测试
为了表征语言网络,本研究采用了一个基于MULTIMAP的句子完成任务。具体来说,使用了一组包含30个物体和30个动作的子集,这些物体和动作在目标语言之间及其内部进行了匹配。目标词在频率、正字法邻近词数量和长度(即5-8个字符)上进行了匹配。此外,刺激材料在视觉复杂性、熟悉度和命名一致性(超过80%)方面也进行了控制。目标名词(平均意象性=6.21,标准差=0.33;平均具体性=5.96,标准差=0.43)和动词(平均意象性=5.27,标准差=0.55;平均具体性=4.66,标准差=0.64)的意象性和具体性值均较高。
该任务包括四个独立的block(每个block包含60个项目):用西班牙语和巴斯克语命名物体,参与者会看到一个物体的图片,前面分别用西班牙语或巴斯克语写着“Esto es…”或“Hori da…”,表示“这就是…”;以及用西班牙语和巴斯克语进行动作命名,参与者会看到一个人正在执行某个动作的图片,前面分别用西班牙语或巴斯克语的代词写着“Él…”/“Ella…”或“Hark…”,表示“他…”或“她…”。参与者需要用图片中描绘的名词或动词来完成句子。在描述物体时,名词必须在数量(如单数或复数)和/或性别(如男性或女性)上保持一致;而在描述动作时,他们必须以第三人称单数形式来生成动词。在每个实验阶段中,物体和动作的block呈现顺序在参与者之间进行了平衡。本研究使用MATLAB 2012b和Cogent Toolbox(http://www.vislab.ucl.ac.uk/cogent.php)来呈现图像(刺激、Matlab脚本及其编译版本可在https://git.bcbl.eu/sgisbert/multimap2上获取)。
行为数据分析
记录参与者的反应,以测量每个试次的准确性和反应时(RTs)。本研究使用了开源的内置软件(SPONGE,可在https://github.com/Polina418/Audio_processing上获取)来半自动检测语音开始。这里的RTs是指图片呈现与参与者口头表达开始之间的间隔。错误的反应或不流畅的表达被排除在最终分析之外。对准确性和反应时进行了配对样本t检验,以比较西班牙语和巴斯克语的产生表现。
MRI/fMRI数据采集
所有参与者(健康对照组和患者)都在3T西门子Magnetom Prisma Fit扫描仪(Siemens AG,Erlangen,Germany)中进行了MRI扫描。使用64通道头线圈和3D超快速梯度回波(MPRAGE)脉冲序列采集高分辨率T1和T2加权像,T1的采集参数为:176个连续的矢状层,体素分辨率为1×1×1mm3,RT=2530ms,ET=2.36ms,图像列数=256,图像行数=256,翻转角=7°;T2的采集参数为:176个连续的矢状层,体素分辨率为1×1×1mm3,RT=3390ms,ET=389ms,图像列数=204,图像行数=256,翻转角=120°。将所有参与者的图像标准化到一个共同的空间,以便进行比较和分析。为了估计将每个个体的图像标准化到MNI空间所需的变换矩阵,本研究结合了T1和T2图像,并采用SPM中实现的统一分割、偏差校正和空间标准化方法。采用以下多波段序列记录平面回波图像:扫描次数=203;层数=72;体素大小=2mm3各向同性;ET=29ms;RT=1.8s;FoV=192mm;矩阵=864×864;翻转角=73°;加速度因子=1;回波间隔=10.42ms。为了确保磁化达到稳定状态,每个功能运行的前六个体积被丢弃。
基于GLM的fMRI数据分析
使用SPM12软件及其相关工具箱(http://www.fil.ion.ucl.ac.uk/spm)分析功能事件相关数据。原始功能扫描数据经过时间层校正(以中间层作为参考)、空间对齐、去畸变、与解剖T1图像配准,并使用标准化的分割程序将图像标准化到MNI空间。然后使用全局信号回归分析去除全局效应,并使用各向同性8mm高斯核对数据进行平滑处理。对每个体素的时间序列进行高通滤波(128s)。使用单变量一般线性模型生成统计参数图,每种刺激类型都有一个回归变量,该回归变量是通过将标准的血流动力学响应函数与刺激开始时的脉冲函数进行卷积得到的,另外还包括六个运动校正参数作为不感兴趣的回归变量。
基于fMRI数据的偏侧化指数估计
语言偏侧化指数(LI)通常是通过分析所有与语言相关脑区的总体活动水平来得出的。虽然左半球通常被认为与语言生成密切相关,但语言的产生并不是左半球所独有的,偏侧化模式取决于我们所关注的语言处理成分。因此,研究语言网络中各个区域的功能偏侧化指标变得越来越重要。在临床环境中,区域性LIs可以为神经外科手术规划提供重要信息,有助于减少术后神经风险。
为测试不同语言的言语产生是否具有相似或不同的大脑偏侧化模式,本研究对西班牙语和巴斯克语的每个ROI进行了LI估计。根据Laterality Index SPM工具箱中实施的无阈值自举法,对于这两种语言,偏侧化指数的估算公式为LI=(左侧-右侧)/(左侧+右侧),正值表示左侧占优势,负值表示右侧占优势。为了减少异常值的影响,最终的LI分数使用了t值分布中间50%的修剪均值。使用AAL图谱在MNI空间构建的54个双侧ROI作为空间约束,覆盖了所有皮层和皮层下空间。对54个ROI的LI分数进行重复测量方差分析(ANOVA),将LI分数作为因变量。两个组内因素包括:(1)语言(西班牙语和巴斯克语)和(2)感兴趣区域(54个ROIs)。使用成对比较进行后续分析,并应用Bonferroni进行多重比较校正。
机器学习方法
采用监督机器学习分类方法来测试两种语言(即西班牙语和巴斯克语)是否可以通过大脑活动的偏侧化特征进行解码。为此,本研究使用了极端梯度提升(XGBoost)算法。这种基于树的算法创建并结合了各自较弱但互补的分类器,从而生成一个更稳健的估计器。此外,该算法在基于语言相关任务的神经活动的二分类中表现出较高的预测性能。本研究将54个ROI获得的LI输入到机器学习分类器中。首先,使用稳健缩放方法对脑特征进行标准化。然后,为了限制偏差并获得更稳健的结果,本研究采用了k折验证方法(k=5),使用85%的样本进行训练,15%的样本进行测试。该测试集从未用于超参数调优或特征选择。使用分层随机选择对数据进行划分,以保持每种条件下的标签比例。
由于分类问题的高维特性(即特征数量多而样本数量少),本研究采用了递归特征消除法(RFE)作为特征缩减策略,旨在去除冗余的非信息变量,从而防止潜在的过拟合问题。重要的是,这种特征缩减仅适用于交叉验证方案中的训练集。最终,样本与特征的比例满足N-1标准,其中N表示用于训练集的样本数量——即用于训练的样本为60个,而特征为8个。此外,在交叉验证方案中,本研究还在训练集中使用网格搜索法进行了超参数调优。
分类器的性能通过在10次迭代中对数据进行不同随机划分(即使用不同的随机种子)获得的均值和标准差进行报告。根据最新的机器学习结果报告指南,本研究计算了分类准确率,以及接收者操作特征(ROC)曲线下面积(AUC)和混淆矩阵,以捕捉分类器的敏感性和特异性。最后,为了增强模型的可解释性,通过SHAP(SHapley Additive exPlanations)值计算特征重要性。SHAP值提供了每个特征对模型预测影响的估计。所有分析均使用Python中的Scikit-learn库(v. 0.22.1)实现。
结果
健康个体双语产生的特征
行为表现
不同语言之间的准确率没有差异(p=0.18),这表明个体在西班牙语(均值=95.35%,标准差=5.03)和巴斯克语(均值=93.32%,标准差=7.48)上的表现相当。同样,两种语言之间的反应时(RTs)也没有显著差异(p=0.90),这表明西班牙语(均值=1062.97ms,标准差=414.79)和巴斯克语(均值=1049.71ms,标准差=407.28)的命名速度大致相同。
基于激活的跨语言效应
语言产生相比于视觉基线,表现出广泛的激活模式,包括两个半球的多个区域。正如预期的那样,这种对比涉及额下回(IFG)的眶部、辅助运动区(SMA)、中央前回和中央后回、中央旁小叶、颞上回(STG)和颞中回(MTG)、顶上回以及小脑等区域。这些区域在西班牙语和巴斯克语中均被双侧激活(图2)。然而,这些区域的激活模式会根据所使用的语言而有所不同。
图2.(A)支持健康双语者语言生成的网络。(B)圆形图表显示了健康双语者在使用西班牙语(红色)和巴斯克语(绿色)时的偏侧化指数。
不同语言在大脑中激活的区域存在差异。一方面,西班牙语>巴斯克语对比组的激活显著增加,包括左侧MTG、左右楔前叶、左侧舌回、右侧角回和小脑。另一方面,巴斯克语>西班牙语对比组在左右中央前回、中央后回和STG;左侧IFG(眶部)、左侧SMA、左侧后岛叶、左侧枕中回、左侧尾状核、右侧IFG(三角部)、右侧颞下回和右侧梭状回等区域产生了更高的激活(详细区域列表见表3;反应模式见图3)。请注意,正如Tao等人(2021)的元分析所预测的那样,这些西班牙语和巴斯克语之间的差异涵盖了与语言控制和执行功能相关的领域一般区域,但除此之外,本研究还观察到了语言特定区域的差异。
表3.由语言主效应引起的显著激活区域。
图3.健康双语者语言主效应的统计参数图。
偏侧化效应
重复测量方差分析结果显示,语言的主效应显著(p=0.001)。具体而言,这一效应表明,在使用巴斯克语时,不仅左半球(语言优势半球)被激活,而且右半球的相关区域也参与了活动。此外,语言与感兴趣区域(ROI)之间存在边缘显著的交互作用(p=0.047)。
机器学习结果
机器学习分类器区分西班牙语和巴斯克语LI的AUC为0.80(±0.18),准确率为74%(±17%),精确度为76%(±20%),召回率为72%(±19%),F1分数为0.73(±0.18)。使用SHAP值估计的特征重要性显示,颞上回、距状皮层、小脑、中央旁小叶、后扣带皮层、中央前回、丘脑和眶额皮层是区分西班牙语和巴斯克语的最具预测性的特征(图4)。
图4.二分类(西班牙语vs.巴斯克语)机器学习结果。
低级别胶质瘤患者双语产生的特征
行为表现
本研究对双语患者的准确率和反应时(RTs)进行了t检验。与健康对照组相似,结果显示双语患者在准确率(p=0.26)和RTs(p=0.69)上均没有显著的语言效应。
基于激活的跨语言效应
临床人群在语言产生任务中显示出横跨两个半球的神经激活模式。这种激活模式涉及多个与语言生成相关的重要区域(图5),包括IFG的眶部、SMA、STG和MTG,以及边缘上回和角回。除了经典的语言中枢外,患者还表现出一种健康对照组中不存在的双侧额顶网络。该网络在空间上与默认模式网络(DMN)对齐,包括楔前叶、后扣带回、眶额/直回以及顶上回等区域。
图5.与临床队列语言生成相关的网络。
在患者组中对比西班牙语和巴斯克语时,本研究发现了显著差异。特别是在西班牙语方面,患者组中激活了苍白球、壳核和丘脑等区域,而这些区域在健康对照组中并未激活。对于巴斯克语,同样观察到了差异,患者在使用非母语时依赖默认模式网络(DMN)来有效地完成任务(图6A和6B)。这些发现表明,每种语言存在不同的补偿机制。
图6.临床队列的统计参数图。
偏侧化效应
与在健康个体中观察到的结果相比,在临床人群中使用偏侧化指数进行重复测量方差分析未发现语言效应(p=0.09),并且语言与ROI之间也没有显著的交互作用(p=0.660)。在深入分析个体临床数据后,发现不同区域的偏侧化指数涵盖了所有可能的值,从−1(表示完全左侧偏侧化)到1(表示完全右侧偏侧化)。这种个体间差异的可视化图如图7所示,其中每个圆形图对应不同的患者。然而,尽管个体间的偏侧化模式各不相同,但与语言相关的变化在各个ROI中都很明显。为了更好地在临床人群中表征这些基于ROI的模式,本研究采用了置换分析,以确定哪些区域在不同个体中始终表现出语言效应(图7)。值得注意的是,该分析揭示了小脑、梭状回、眶额皮层、顶上回和缘上回等区域在对西班牙语和巴斯克语的反应中表现出不同的激活。
图7.圆形图显示了西班牙语和巴斯克语每个ROI的偏侧性变化。
结论
尽管双语者在不同语言的表现上存在相似性,但他们的双语经验和神经解剖结构之间存在某种联系。这种联系不仅影响与执行功能相关的领域一般区域,也反映在语言特定区域的功能动态变化中。本研究结果表明,在正常情况下,处理非优势语言需要基底神经节-丘脑-皮层回路的参与,这对于产生优势语言不是必需的。然而,对脑肿瘤患者的分析显示,在影响两种语言产生的网络中存在显著灵活性,尽管存在一些特定于语言的差异。综上所述,这些证据强调了双语言语产生的机制具有灵活性,并且涉及大脑中其他区域,而不仅仅是传统的语言处理区域。该系统包括确保在健康和疾病状态下做出有效反应的自适应机制。这些结果对低级别胶质瘤双语患者的术前评估和后续治疗具有重要意义。识别对双语语言处理至关重要的特定脑区,为制定有针对性和有效的治疗方法开辟了新的可能性,最终改善患者的治疗效果。
参考文献:Quiñones, I., Gisbert-Muñoz, S., Amoruso, L. et al. Unveiling the neuroplastic capacity of the bilingual brain: insights from healthy and pathological individuals. Brain Struct Funct (2024). https://doi.org/10.1007/s00429-024-02846-9
小伙伴们关注茗创科技,将第一时间收到精彩内容推送哦~