异位妊娠唯一相关的是年龄(U型曲线)
简介
异位妊娠,俗称宫外孕,是指受精卵在子宫体腔以外着床发育的异常妊娠过程 。正常情况下,受精卵会在子宫内着床并发育成胎儿,但在异位妊娠中,受精卵却在输卵管、卵巢、腹腔等子宫以外的地方 “安营扎寨”。其中,输卵管妊娠最为常见,约占异位妊娠的 95%。
与年龄的相关性
年轻女性(小于 25 岁):生殖系统发育尚未完全成熟,激素水平不稳定,可能会影响输卵管的蠕动和受精卵的输送,增加异位妊娠风险。另外,一些年轻女性性生活开始早,不注意卫生,容易引发盆腔炎,炎症波及输卵管,导致输卵管粘连、狭窄,阻碍受精卵正常运行。
高龄女性(大于 35 岁):卵巢功能逐渐衰退,激素分泌失衡,影响卵子质量和输卵管功能。而且随着年龄增长,输卵管可能出现生理性变化,如蠕动能力减弱、管腔变窄等,使受精卵在输卵管内运行受阻,更易发生异位妊娠。此外,高龄女性可能患有一些慢性疾病,如高血压、糖尿病等,这些疾病也可能对生殖系统产生不良影响,增加异位妊娠的发生几率。
数据集介绍
本数据集名为 ‘ectopic.xls’,包含了一个工作表,名为 ‘Sheet1’。工作表 ‘Sheet1’ 含有 2060 行,15 列,数据集包含如下字段:
patient_id:患者编号,用于唯一标识每个患者,数据类型为 int64。
age:患者年龄,以整数形式记录,数据类型为 int64。
ectopic_yes:可能表示当前是否有异位妊娠情况,用 0 和 1 表示,数据类型为 int64。
ectopic_past:可能表示过去是否有异位妊娠史,用 0 和 1 表示,数据类型为 int64。
Genital surgery in the past:过去是否有生殖器手术史,用 0 和 1 表示,数据类型为 int64。
psychiatric_disease:是否有精神疾病,用 0 和 1 表示,数据类型为 int64。
Vulvitis:是否有外阴炎,用 0 和 1 表示,数据类型为 int64。
Endometriosis:是否有子宫内膜异位症,用 0 和 1 表示,数据类型为 int64。
Erosion and ectropion of cervix uteri:是否有宫颈糜烂和外翻,用 0 和 1 表示,数据类型为 int64。
Noninflammatory disorders of vagina, unspecified:是否有未指明的阴道非炎症性疾病,用 0 和 1 表示,数据类型为 int64。
Absent, scanty, and rare menstruation:是否有月经缺失、稀少或罕见的情况,用 0 和 1 表示,数据类型为 int64。
irregular menstruation:是否有月经不调,用 0 和 1 表示,数据类型为 int64。
vaginal bleeding:是否有阴道出血,用 0 和 1 表示,数据类型为 int64。
Mid - cycle pain:是否有中期疼痛(可能指排卵期疼痛),用 0 和 1 表示,数据类型为 int64。
Dysmenorrhea:是否有痛经,用 0 和 1 表示,数据类型为 int64。
总体而言,这个数据集可能用于研究与女性生殖健康相关的因素,特别是异位妊娠与患者年龄、病史等因素之间的关系。
分享
结果
Boruta筛选结果仅发现年龄是唯一相关因素,其它的因素都不是相关的因素,然后使用SHAP分析来对分析异位妊娠与年龄之间的关系,并采用曲线拟合。
25.5岁以下是异位妊娠风险阶段,年龄越小风险越大;
38岁以上是异位妊娠风险阶段,年龄越大风险越大。
最后
SHAP分析的结果与已有的认知相符合。
同时说明SHAP分析变量间的关系是可行的一种方法。
项目地址:https://www.heywhale.com/mw/project/67ac56722248a2c0cacbf039