文章发表 | 求臻医学发布精准肿瘤学临床试验预筛选平台

caf621fa7a1dcb4338b596a2d7d732f1.jpeg

近日,求臻医学信息与人工智能团队研发的精准肿瘤学临床试验预筛选平台OncoCTMiner,在线发表于国际期刊Database: The Journal of Biological Databases and Curation (IF=5.8)。OncoCTMiner集成自然语言处理(NLP)和大型语言模型(LLM)等人工智能技术,通过挖掘46万余条临床试验数据,构建了一个全面的精准肿瘤学入排条件数据库,助力肿瘤患者精准筛选可入组的临床试验。

e32f67cf77a82e830c06d67e4997c05c.jpeg


研究背景

随着对肿瘤患者肿瘤分子特征的不断深入研究,分子肿瘤学已经成为癌症治疗不可或缺的组成部分。这一研究方向有助于确定新的治疗靶点,推动精准医学治疗的广泛应用。基于遗传标记的个体化癌症治疗可以提高治疗反应率并延长无进展生存期。然而,尽管许多靶向治疗和免疫治疗处于临床试验阶段,但为了更好地推进癌症治疗,需要更多的参与者加入。虽然基因组分析的力度在不断增加,但令人遗憾的是,仅有约8%的癌症患者有机会参与临床试验。这主要是因为医生缺乏对可接受研究的了解,同时也受制于患者的状态、态度和经济状况等多重因素。


此外,将患者的基因数据与精准肿瘤学试验的入排条件相匹配也是一个挑战。在没有复杂试验匹配系统的情况下,医生必须手动浏览数百个不断更新的临床试验,以找到适合特定患者的临床实验。即使在顶级的癌症中心,肿瘤学家也会对他们的遗传专业知识表示质疑。


因此,为了解决患者-临床试验匹配的问题,我们自主研发了精准肿瘤学临床试验预筛选平台OncoCTMiner(图1),以期帮助肿瘤患者和临床医生快速高效地筛选潜在合适的临床试验,加速精准肿瘤学临床试验的进展,为患者带来新的希望。

1461a593d562d0e48234234ae86adffc.jpeg

图1. OncoCTMiner平台整体概览


研究设计

1)通过下载并解析ClinicalTrials.gov网站注册的临床试验,将其转化为便于后续NLP处理的BioC-JSON格式(图2)。全部过程利用脚本进行自动化处理,便于定期对数据库进行更新。

222c1e33395bbcda6bb4b15a20a0dcc5.jpeg

图2. OncoCTMiner 模块


2)将全部已解析的数据导入基于OncoPubMiner系统升级开发而来的临床试验数据标注平台OncoCTMiner(TaggingModule),经由生物医学专家对其中预筛选出来的与肿瘤精准诊疗相关的临床试验进行实体标注(图3)。多重审核后,构成了标准数据集,用于后续NLP模型的训练。

377cb9c2f8a8ac1e29d2a6e6a29a0a2c.jpeg

图3. OncoCTMiner临床试验数据标注与审核平台


3)基于标准数据集进行NLP模型训练,用于识别全部临床试验中涉及的各类生物医学实体(疾病/癌症、基因、变异、药物、生物标志物、治疗方案),及其所属的入排条件(NA<未知>、NC<非入排条件>、IN<入组条件>、EX<排除条件>)。


4)基于训练的实体识别及入排条件分类模型,对余下的临床试验进行自动化挖掘。通过挖掘结果构建数量庞大的精准肿瘤学临床试验入排条件数据库OncoCTMiner-DB。同时,提供检索功能丰富且界面友好的试验搜索引擎。


5)开发多组学变异注释流程OncoCTMiner-Anno,可以对VCF、Excel或文本格式的变异数据进行自动化分析注释。结合用户提供的临床诊断信息,一键式生成临床试验匹配报告,方便患者快捷、精准地匹配潜在合适的临床试验(图4)。

0d6a417736d40fe984ce4748b6a97591.jpeg

图4. OncoCTMiner临床试验匹配策略


研究结果

1.数据库

OncoCTMiner-DB数据库当前收录临床试验472,493条(数据库持续更新中,该数据为截至发稿时的数据,下同),128,976条为肿瘤相关临床试验,其中2,256条经过生物医学专家标注和多重审核。从这些临床试验中,识别出6大类共计8,152,420个生物医学实体,以及9,326,762对“实体-入排条件-临床试验”三元组(图5)。

de954d3276d5144f8980806b5cc67171.jpeg

图5. OncoCTMiner部分数据统计


2.搜索引擎

OncoCTMiner提供了功能丰富的精准肿瘤学临床试验搜索引擎,支持通过试验ID、癌种/疾病、基因、变异、药物、生物标志物(TMB、MSI等)、治疗方案等进行快速检索,并可以通过临床试验各种元数据(分期、性别、年龄、国别等)进行过滤。更重要的是,该搜索引擎支持通过实体所属的入排标准(入组条件/排除条件)进行精准搜索,这有助于过滤掉大量假阳性搜索结果,帮助用户快速筛选到符合条件的临床试验(图6)。

727c91f34df1cc70e6dff8c26013d404.jpeg

图6. OncoPubMiner临床试验搜索引擎


3.患者-试验匹配平台

b1971f882a1f8c9d7963b6eb8032165d.jpeg

图7. 患者-试验匹配功能及匹配报告


在患者-试验匹配(临床试验预筛选)任务提交页面,用户可以上传VCF格式变异(或者注释好的变异检测结果),选择癌种类型,设定各种有助于缩小筛选范围的参数(可选)后,即可提交注释任务。系统将在合理地时间内返回匹配结果报告。如果返回结果过多,用户还可利用试验过滤功能对结果列表进行过滤,直到得到最合适的试验匹配结果(更详细信息,可阅读OncoCTMiner论文,或者访问OncoCTMiner官网)。


研究总结

在本项目中,求臻医学成功研发了一套精准肿瘤学临床试验预筛选平台——OncoCTMiner。通过综合运用人工智能技术以及人工标注与审核,我们对超过46万条临床试验数据进行了深入挖掘,构建了一套全面的精准肿瘤学临床试验入排条件数据库。


基于这一创新平台,求臻医学实现了患者招募业务的自动化匹配,能够为肿瘤患者提供快速而精准的临床试验匹配服务,推动潜在高效肿瘤治疗方法的研发,为更多癌症患者带来福音。


在具体的临床实验匹配过程中,借助OncoCTMiner自动化临床试验预筛选平台,助力药企完成患者靶点与临床试验的高效初步匹配后,求臻医学药企合作部专业团队将与患者进行深度沟通,提供个性化、专业化的临床试验服务,助力更多癌症患者从创新药物治疗中获益。


未来,OncoCTMiner将整合至求臻医学自动化报告解读系统ChosenSmartReport,同步对肿瘤患者基因检测结果进行自动化分析和临床试验匹配,为检测患者提供免费、高质量且精准的试验匹配服务,为肿瘤患者带来更便捷、全面的医疗体验。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/145826.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Enfocus PitStop Pro 2022

Enfocus PitStop Pro是一款专为PDF编辑和优化而设计的软件&#xff0c;旨在帮助用户高效、准确地处理PDF文件。其功能包括但不限于&#xff1a; 全面的PDF编辑功能&#xff1a;包括添加、删除或重新排列页面&#xff0c;合并和分割PDF文件&#xff0c;以及调整页面大小和方向等…

Linux 函数库

函数库&#xff1a; 我们的C程序中&#xff0c;并没有定义“printf”的函数实现,且在预编译中包含的“stdio.h”中也只有该函数的声明,而没有定义函数的实现,那么,是在哪里实“printf”函数的呢? 最后的答案是:系统把这些函数实现都被做到名为 libc.so.6 的库文件中去…

人工智能基础_机器学习032_多项式回归升维_原理理解---人工智能工作笔记0072

现在开始我们来看多项式回归,首先理解多维 原来我们学习的使用线性回归,其实就是一条直线对吧,那个是一维的,我们之前学的全部都是一维的对吧,是一维的,然后是多远的,因为有多个x1,x2,x3,x4... 但是比如我们有一个数据集,是上面这种,的如果用一条直线很难拟合,那么 这个时候,…

美国受教育程度最高的五大城市

许多研究表明&#xff0c;高等教育水平对一个城市的经济发展可起到决定性的作用。美国最繁荣、经济最活跃的地区无一例外都是拥有本科和研究生学位居民的集中地。本篇知识人网小编就为大家介绍美国受教育程度最高的五大城市。 本文根据主页菌在“Stoooges三士渡”刊载的文章整理…

通过cpolar实现外网ssh远程连接linux

现在我有个想法&#xff0c;就是希望通过外网能够远程连接到我的开发板。这里我们就需要使用到一种技术&#xff0c;内网穿透。 内网穿透是一种将内部网络中的设备通过外网进行访问的技术。在linux系统中&#xff0c;实现内网穿透有多种方式&#xff0c;其中最常见的方法是使用…

Postman还能做Mock?又学了一招!

&#x1f4e2;专注于分享软件测试干货内容&#xff0c;欢迎点赞 &#x1f44d; 收藏 ⭐留言 &#x1f4dd; 如有错误敬请指正&#xff01;&#x1f4e2;交流讨论&#xff1a;欢迎加入我们一起学习&#xff01;&#x1f4e2;资源分享&#xff1a;耗时200小时精选的「软件测试」资…

A Gentle Introduction to Graph Neural Networks

A Gentle Introduction to Graph Neural Networks----《图神经网络入门》 图神经网络信息传递积累 图在我们身边随处可见&#xff0c;现实世界中的物体通常是根据它们与其他事物的联系来定义的。一组物体以及它们之间的联系可以很自然地用图来表示。十多年来&#xff0c;研究人…

AWS实战(一)-创建S3 存储桶

1&#xff09;登录AWS账号&#xff0c;选择服务—>存储—>S3。 2&#xff09;查看存储桶列表 3&#xff09;点击"创建存储桶"创建bucket。 4&#xff09;设置跨域 点击编辑&#xff0c;修改跨域设置即可。

工具: PowerShell常用命令

ISE: 打开ISE编辑器 echo: 输出一行信息 mkdir: 创建一个文件夹 mkdir ./MyPlugin文件相关处理 参考&#xff1a; powershell新手向&#xff0c;新建、删除文件及对文件添加内容 参考文档 PowerShell入门教程 语法、环境| Powershell 教程

【springmvc框架一文搞定】

SpringMVC框架 1. 搭建springmvc测试项目1.1 创建maven项目1.2 导入依赖pom.xml1.3 将springmvc容器加载到tomcat中1.4 启动tomcat插件1.5 访问路径&#xff1a; 2. 剖析启动过程2.1 启动服务器初始化过程2.2 访问路径执行过程 3.spring-springmvc bean的管理3.1 因为功能不同&…

langchain实战-hello world

一、LangChain简介 github地址&#xff1a; GitHub - langchain-ai/langchain: ⚡ Building applications with LLMs through composability ⚡ LangChain是一个用于开发由语言模型支持的应用程序的框架。它使应用程序能够&#xff1a; 具有上下文感知能力&#xff1a;将语言模…

BES2700H开发不完全手册

BES2700H开发不完全手册 是否需要申请加入数字音频系统研究开发交流答疑群(课题组)&#xff1f;可加我微信hezkz17, 本群提供音频技术答疑服务&#xff0c;群赠送语音信号处理降噪算法&#xff0c;ANC AEC ENC EQ BF BES蓝牙耳机音频资料 1 成功编译 2 代码 3 开放文档

餐饮业数字化革命:抖音小程序团购功能的开发与优化

本文将聚焦于餐饮业数字化的前沿&#xff0c;着眼于抖音小程序团购功能的开发与优化&#xff0c;探讨如何借助这一功能实现餐饮业的蓬勃发展。 一、数字化浪潮下的餐饮业 传统餐饮业面临的挑战在于如何更好地适应快节奏生活和消费者多元化需求。数字化浪潮为餐饮业提供了解决方…

[Linux] ssh远程访问及控制

一、ssh介绍 1.1 SSH简介 SSH&#xff08;Secure Shell&#xff09;是一种安全通道协议&#xff0c;主要用于实现远程登录、远程复制等功能的字符接口。SSH 协议包括用户在登录时输入的用户密码、双方之间的通信。 加密数据传输&#xff0c;SSH 是一种建立在应用层和传输层上…

第06章 面向对象编程(基础)

一 面向对象编程概述 1.1 程序设计的思路 面向对象&#xff0c;是软件开发中的一类编程风格、开发范式。除了面向对象&#xff0c;还有面向过程、指令式编程和函数式编程。在所有的编程范式中&#xff0c;我们接触最多的还是面向过程和面向对象两种。 类比&#xff1a;史书类…

manim更新

manim升级18.0 # 1 更新pip&#xff0c;推荐轮子下载 python -m pip install --upgrade pip 推荐方式下载轮子安装 首先尝试在中断更新pip&#xff0c;通过命令python -m pip install --upgrade pip 可能遇到以下情况 记录最新的pip轮子名 记录下上面pip的名称&#xff0c;去…

得帆信息携手深信服,联合打造高安全PaaS超融合一体化解决方案

上海得帆信息技术有限公司&#xff08;以下简称“得帆”&#xff09;和深信服科技股份有限公司&#xff08;以下简称“深信服”&#xff09;携手推出融合安全性、稳定性、高效性于一体的全新PaaS超融合解决方案。 用户痛点分析 全面推进企业数字化与信息化的趋势下&#xff0c;…

深入探讨Linux中的文本文件查看命令

目录 前言1 cat命令2 less命令3 more命令4 head命令5 tail命令6 总结 前言 在Linux系统中&#xff0c;文本文件是日常工作中不可或缺的一部分&#xff0c;无论是配置文件、日志文件还是代码文件&#xff0c;都需要用到文本文件查看命令。在本文中&#xff0c;我们将深入研究一…

块设备的工作模式

块设备的mknod 还是会创建在 /dev 路径下面&#xff0c;这一点和字符设备一样。/dev 路径下面是 devtmpfs 文件系统。这是块设备遇到的第一个文件系统。我们会为这个块设备文件&#xff0c;分配一个特殊的 inode&#xff0c;这一点和字符设备也是一样的。只不过字符设备走 S_IS…