自闭症谱系障碍(ASD)是一种多方面的神经发育状况,影响全球大约1/100的儿童,而在中国,这一比例高达1.8%(引用自《中国0~6岁儿童孤独症谱系障碍筛查患病现状》),男童为2.6%,女童为0.9%。ASD的特点是社交互动困难、沟通挑战和重复行为。患有ASD的儿童通常会出现感官敏感性,并表现出症状严重程度差异很大的广泛谱系。自闭症患病率的增加使其成为关键的公共卫生问题,突显了早期诊断和干预的必要性。尽管对ASD的理解有所进步,但由于每个个体表现出的多样性,其管理仍然复杂。
ASD的诊断和治疗需要多学科方法,涉及各种医疗专业人员,他们在其中扮演着重要角色。诊断过程通常始于儿科医生根据发育里程碑进行初步筛查。如果发现问题,儿童会被转介给心理学家等专家,使用标准化测试和行为观察进行全面评估。言语治疗师评估和解决沟通困难,而职业治疗师专注于提高日常生活技能和感官处理。精神病学家可能会管理如焦虑或ADHD等共同发生的疾病,心脏病学家可能参与解决任何相关的身体健康问题。这种协作方法对于制定满足每个儿童独特需求的定制治疗计划至关重要。
1 ASD 诊断和治疗的现状
1.1 传统 ASD 诊断方法的局限性
- 主观性: 传统诊断方法主要依赖于临床评估和行为观察,容易受到评估者经验和主观判断的影响,导致诊断结果不一致。
- 缺乏客观指标: 传统诊断方法缺乏客观的生理或生物标志物,难以对 ASD 进行早期和准确的诊断。
- 耗时费力: 传统诊断方法需要多次评估和测试,耗时费力,增加了患者的负担。
1.2 传统 ASD 治疗方法的挑战
- 缺乏个性化: 传统治疗方法往往采用标准化的方案,难以满足每个患者的个体化需求。
- 缺乏持续监测: 传统治疗方法缺乏对患者治疗进展的持续监测和评估,难以及时调整治疗方案。
- 缺乏有效沟通: 医疗专业人员之间缺乏有效的沟通和协调,难以提供连贯的治疗服务。
2 方法
2.1 数据集
本研究使用了包含自闭症儿童和神经典型儿童步态和全身运动分析的 3D 数据集。该数据集使用 Kinect v2 摄像机收集,包括 3D 关节位置、骨架运动视频、关节轨迹视频和三星 Note 9 后置摄像头拍摄的颜色视频。数据集包含 700 个文件夹,其中自闭症儿童和神经典型儿童各占一半,每个群体包含 350 个文件夹。此外,数据集还包含 9 名重度自闭症儿童的颜色视频,以增强科学研究的深度。
2.2 面部和身体表情提取
本研究使用了迁移学习技术,利用多个预训练的卷积神经网络 (CNN) 模型来提取面部和身体表情。主要考虑的模型包括:
- VGG19
- Xception
- ResNet50V2
- MobileNetV2
- EfficientNetB0
这些模型被选择是因为它们在图像分类任务中表现出色。
2.3 数据预处理
- 图像尺寸调整: 将每个图像调整到符合所选 CNN 模型输入要求的尺寸。
- 图像归一化: 将像素值缩放到 0 到 1 的范围,以提高模型的训练效率。
- 数据增强: 使用旋转、翻转和缩放等数据增强技术来增加数据集的大小和多样性,并防止过拟合。
2.4 迁移学习
- 模型初始化: 使用在 ImageNet 数据集上预训练的模型权重初始化 CNN 模型。
- 模型修改: 将模型的最后几层修改为用于二元分类的层,即区分自闭症儿童和神经典型儿童。
2.5 模型训练
- 数据集划分: 将数据集划分为训练集、验证集和测试集。
- 超参数调整: 通过消融研究调整学习率、批大小和训练周期等超参数。
- 优化器选择: 选择 Adagrad 优化器,因为它在处理稀疏数据方面效率较高。
- 损失函数: 使用二元交叉熵损失函数来计算预测值和实际值之间的差异。
- 反向传播: 使用反向传播算法来更新模型权重。
- 早停机制: 使用早停机制来防止过拟合。
2.6 伦理考虑和偏差缓解
本研究采取了以下措施来确保 AI 模型的伦理性和公平性:
- 数据匿名化: 对所有患者数据进行匿名化处理,以保护个人隐私。
- 数据安全: 将数据存储在安全、加密的数据库中,并限制对数据的访问权限。
- 模型透明度: 提供模型算法和方法的详细文档,并使用可解释 AI (XAI) 技术来解释模型的决策过程。
- 偏差缓解: 通过收集多样化的数据集和使用偏差检测和缓解技术来减少模型偏差。
3 评估及结论
3.1 评估指标
- 准确率 (Accuracy): 准确率衡量模型预测结果的总体正确性,计算公式为:准确率 = (真阳性 + 真阴性) / (总样本数)
- 精确率 (Precision): 精确率衡量模型正确识别自闭症儿童的比例,计算公式为:精确率 = 真阳性 / (真阳性 + 假阳性)
- 召回率 (Recall): 召回率衡量模型识别所有自闭症儿童的能力,计算公式为:召回率 = 真阳性 / (真阳性 + 假阴性)
- AUC (Area Under the Curve): AUC 衡量模型区分自闭症儿童和神经典型儿童的能力,取值范围为 0 到 1,值越高表示模型的区分能力越强。
3.2 评估过程
- 数据集划分: 将数据集划分为训练集、验证集和测试集。训练集用于模型训练,验证集用于模型调整,测试集用于最终模型评估。
- 模型训练: 使用训练集训练 AI 模型,并进行超参数调整,以提高模型性能。
- 模型评估: 使用验证集和测试集评估模型性能,并计算准确率、精确率、召回率和 AUC 等指标。
3.3 评估结论
- 模型性能: Xception 和 ResNet50V2 模型在提取自闭症儿童面部和身体表情方面表现出色,并取得了较高的诊断准确率。MobileNetV2 模型也表现出良好的泛化能力,但精确率和召回率略低于前两种模型。VGG19 和 EfficientNetB0 模型则存在一定的过拟合问题,需要进一步优化。
- 数据连续性: 本研究强调了连续收集和分析自闭症儿童面部和全身表情数据的重要性,以全面了解 ASD 的行为模式,并为诊断和治疗提供有价值的见解。
4 扩展了解 ASD诊断软件Cognoa Canvas Dx(已获FDA授权)
Canvas Dx成为第一个也是目前唯一一个通过FDA审批的自闭症筛查软件。Canvas Dx用于诊断18个月至5岁儿童的自闭症谱系障碍,以促进自闭症的早期发现和治疗。该软件不能用作独立的诊断设备,而是作为诊断过程的辅助设备,仅供处方使用。