病理组学分析系列教程1:使用Python-histolab进行病理图像预处理,tiles切片自动生成

首先,先上参考资料链接:

了解数字病理影像图片WSI如何切割-使用histolab

视频详细讲解使用histolab进行病理图像切分

详细介绍数字病理图像的存储格式及格式转换工具介绍

一、病理图像预处理

        相信很多朋友对于WSI这种巨大的病理图像的预处理都觉得束手无策,其实我一开始也是,总觉得几个G的图像该如何预处理才能使其适合深度学习的输入呢?我们看到很多文献都是说将一个完整的WSI切分成tiles(处理成512*512或者1024*1024等分辨率),但是如何切分呢?需要什么样性能的设备才能够满足处理要求呢?在网上搜教程大多数的描述也都是浅尝辄止。

        接下来我将使用自己本地的台式机(配置:内存64G;显卡:4090; CPU:Intel 13代 i9-13900K)进行病理WSI的tiles花式切分。

        裁剪的要领是什么?就是保留尽可能多的WSI的靶区,然后剔除掉空白或者多余的部分。目前常用的病理图像处理的桌面工具有imagescope、Cellprofier、Qupath。我们进行Qupath的病理图像查看示范,这是一个完整的病理SVS格式的图像。左侧方框内是图像的详细信息,可以进行标注,分割,特征提取等操作。

        虽然Qupath已经非常强大,但是要进行深度学习的大批量病理图像tiles切分和预处理,还是效率差了一些。当我们需要训练模型做深度学习时,需要输入的图片往往是要成千上万塞入深度学习网络进行学习的,需要将一张完整的WSI切分N个tiles进行后续分析,大小在256*256左右,这个时候其实大小需要自己设置,那怎么办呢?

Histolab-强大的病理图像处理库:https://pypi.org/project/histolab/(教程非常齐全)

安装方法:创建病理图像处理的虚拟环境之后,直接 pip install histolab,支持Python3.8及以上的版本。

1. 首先是读入并查看WSI的详细图像信息:

from histolab.slide import Slide
import os


BASE_PATH = os.getcwd()  # 获取当前工作目录
print(BASE_PATH)  # 输出当前工作目录

HCC_path = './WSI_data/57967.svs'  # SVS文件路径
path = r"./WSI_data/57967"  # 切割后图片存放的位置
HCC_slide = Slide(HCC_path,processed_path=path)  # 实例化slide对象

print(f"Slide name:{HCC_slide.name}") # 输出slide名称
print(f"Levels:{HCC_slide.levels}") # 输出slide的可用放大级别
print(f"Dimensions at level 0:{HCC_slide.dimensions}")  # 输出级别0的slide的尺寸,一般level0是原始图像尺寸,接下来的level1、level2、level3是缩小的尺寸
print(f"Dimensions at level 1:{HCC_slide.level_dimensions(level=1)}") # 输出级别1的slide的尺寸
print(f"Dimensions at level 2:{HCC_slide.level_dimensions(level=2)}") # 输出级别2的slide的尺寸
print(f"Dimensions at level 3:{HCC_slide.level_dimensions(level=3)}") # 输出级别3的slide的尺寸
print("Native magnification factor:", HCC_slide.level_magnification_factor()) # 输出slide的原生放大倍率

print("Magnification factor corresponding to level 0:", HCC_slide.level_magnification_factor(level=0), ) # 输出级别0的slide的放大倍率
print("Magnification factor corresponding to level 1:", HCC_slide.level_magnification_factor(level=1), ) # 输出级别1的slide的放大倍率
print("Magnification factor corresponding to level 2:", HCC_slide.level_magnification_factor(level=2), ) # 输出级别2的slide的放大倍率
print("Magnification factor corresponding to level 3:", HCC_slide.level_magnification_factor(level=3), ) # 输出级别3的slide的放大倍率

HCC_slide.thumbnail   # 输出slide的缩略图

运行速度非常快,我的设备上只需要0.2s,该WSI图像的大小是2.57G,  运行结果如下:

 

2. 不同的裁剪Tiles方式设置(随机抽取、网格提取,基于分数的提取), 

        histolab的优势:histolab具有自动检测具有最大连接区域的组织区域并裁减该区域内的tile的功能,不同的tiler模块可实现不同的tile提取策略。

2.1 随机抽取最大连接区域的组织区域并裁剪tiles,运行RandomTiler方法,其中的tile_size, n_tiles, level, prefix, suffix参数分别根据自身的要求设置,依次代表切分的tiles的尺寸,数目, 分辨率层级,创建子文件夹的名字,保存图像的类型。其中check_tissue参数设置为True才能仅获取有足够组织图像的区域,否则会包括空白的区域。

from histolab.tiler import RandomTiler  # 导入RandomTiler类

"""
histolab自动检测具有最大连接区域的组织区域并裁减该区域内的tile
"""
# 实例化RandomTiler类
random_tiles_extractor = RandomTiler(
    tile_size=(224, 224),  # 设置裁剪的tile尺寸
    n_tiles=500,   # 设置生成的tile数量
    level=1,   # 设置tile的分辨率层数
    seed=42,  # 设置随机数种子
    check_tissue=True, # 设置为True时,仅保留具有组织的tile, 否则保留所有tile
    tissue_percent=80.0, # 介于0-100之间的数字,表示图像中总面积中所需的最小组织百分比(默认为80.0)
    prefix="RandomTiles/", # 会自动在WSI文件所在的文件夹中创建WSI文件名命名的子文件夹,并在该子文件夹中创建RandomTiles子文件夹并保存tiles
    suffix=".png" # 要添加到tiles文件名末尾的文件类型后缀(默认为.png)
)

# 运行locate_tiles()方法,将图块定位到slide中,可以预览图块的位置,不满意的话可以调整参数
random_tiles_extractor.locate_tiles(
    slide=HCC_slide,
    scale_factor=24, # default
    alpha=128, # default
    outline="red", # 以红色方框显示定位的图块
)

显示随机获取的tiles切片定位预览图像

保存随机抽取的这500张tiles到指定文件夹下(RandomTiles),只有运行了下面这行代码才会保存这些tiles

# 运行extract()方法将图块保存到磁盘
random_tiles_extractor.extract(HCC_slide)

2.2 使用网格区域划分来获取所有的tiles,注意这是划分所有的切片而非随机抽取。根据上面读入的WSI图像,我们可以对其网格区域进行全范围搜索可用切片,并将切片结果保存为png图像文件。

from histolab.tiler import GridTiler


grid_tiles_extractor = GridTiler(
   tile_size=(512, 512),
   level=1, # 由于这是全局网格切片,如果设置level=0,则由于分辨率非常高导致运行时间非常长,所以这里设置为1
   check_tissue=True, # 挑选出有组织的区域
   pixel_overlap=0, # default
   prefix="grid/", # save tiles in the "grid" subdirectory of slide's processed_path
   suffix=".png" # default
)

grid_tiles_extractor.locate_tiles(
    slide=HCC_slide,
    scale_factor=64,
    alpha=64,
    outline="#046C4C",
)

预览网格切分的图像定位,注意如果上面的check_tissue设置为false,则保存的是所有WSI区域,包含空白的区域。

保存tiles,使用下面这行代码保存切分好的tiles

grid_tiles_extractor.extract(HCC_slide)

2.3 基于分数的tiles分割方法 ScoreTiler,它允许我们根据特定的评分函数仅保存使用网格结构提取的所有tiles中最佳的“tile”。例如,具有较高核存在的tile比具有很少或没有核的tile更可取。

from histolab.tiler import ScoreTiler
from histolab.scorer import NucleiScorer

scored_tiles_extractor = ScoreTiler(
    scorer = NucleiScorer(),
    tile_size=(512, 512),
    n_tiles=100,
    level=1,
    check_tissue=True,
    tissue_percent=80.0,
    pixel_overlap=0, # default
    prefix="Scored/", # save tiles in the "scored" subdirectory of slide's processed_path
    suffix=".png" # default
)

scored_tiles_extractor.locate_tiles(slide=HCC_slide)

得到的tiles定位预览图如下:

保存tiles和tiles组织评分表,组织评分表会保存在最开始定义的path文件夹下。tiles会在path文件夹下创建Scored子文件夹然后进行保存

summary_filename = "summary_HCC_tiles.csv"
SUMMARY_PATH = os.path.join(HCC_slide.processed_path, summary_filename)

scored_tiles_extractor.extract(HCC_slide, report_path=SUMMARY_PATH)

 保存好的组织评分表的内容如下:

生成的tiles如下:

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/926079.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

kubernetes——part3-2 集群声明式文件YAML

一、YAML介绍 YAML 的意思是:仍是一种标记语言,但为了强调这种语言以数据做为中心,而不是以标记语言为重点。是一个可读性高,用来表达数据序列的格式。 二、基本语法 1.低版本缩进时不允许使用Tab键,只允许使用空格…

使用Postman搞定各种接口token实战

现在许多项目都使用jwt来实现用户登录和数据权限,校验过用户的用户名和密码后,会向用户响应一段经过加密的token,在这段token中可能储存了数据权限等,在后期的访问中,需要携带这段token,后台解析这段token才…

什么是换电系统?驱动新能源汽车发展的“能源驿站”

随着新能源汽车保有量上升,新能源汽车充换电设施需求量同步增加。由于我国土地、电力资源相对紧张,随着车辆保有量继续增加,换电模式有望成为对充电模式的良好补充,具备广阔的中长期发展前景。蔚来是换电领域的先行者,…

Power BI - Connect to SharePoint online list with Image column

1.简单介绍 当前SharePoint online list有modern和classic两种模式,现在使用modern模式的比较多。list中有Image类型的列,Power BI如何连接到SharePoint list并显示image呢 note, SharePoint list中的Image列,Lookup列,People列…

[在线实验]-Redis Docker镜像的下载与部署

镜像下载 dockerredis镜像资源-CSDN文库 加载镜像 使用以下命令从redis.tar文件中加载Docker镜像 docker load --input redis.tar 创建映射目录 为了确保Redis的数据能够持久化,我们需要创建一个本地目录来存储这些数据 mkdir -p datasource/docker/redis 运…

redis学习(016 实战:黑马点评:分布式锁:Redisson)

黑马程序员Redis入门到实战教程,深度透析redis底层原理redis分布式锁企业解决方案黑马点评实战项目 总时长 42:48:00 共175P 此文章包含第64p-第p68的内容 文章目录 分布式锁的优化Redission操作编写代码 Redission可以实现可重入锁的原理lua脚本编写可重入锁获取…

SystemUI 下拉框 Build 版本信息去掉

需求及场景 去掉SystemUI 下拉框 Build 版本信息 如下图所示:去掉 12 (SP1A.201812.016) 了解 去掉之前我们先了解它是个什么东西:其实就是一个Build RTM 信息显示 Android_12_build_SP1A.210812.016 修改文件 /frameworks/base/packages/Syste…

UE5 打包报错 Unknown structure 的解决方法

在虚幻引擎5.5 打包报错如下: UATHelper: 打包 (Windows): LogInit: Display: LogProperty: Error: FStructProperty::Serialize Loading: Property ‘StructProperty /Game/Components/HitReactionComponent/Blueprints/BI_ReactionInterface.BI_ReactionInterface…

电子电气架构 --- 面向服务的汽车诊断架构

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 所有人的看法和评价都是暂时的,只有自己的经历是伴随一生的,几乎所有的担忧和畏惧,都是来源于自己的想象,只有你真的去做了,才会发现有多快乐。…

分布式协同 - 分布式锁一二事儿

文章目录 导图Pre概述概述1. 分布式互斥和临界资源的协调2. 分布式锁的基本原理3. 分布式锁的实现方式a. 基于数据库实现的分布式锁b. 基于Redis实现的分布式锁c. 基于Zookeeper实现的分布式锁 4. 高并发场景下的分布式锁优化a. 分段锁(Sharded Locks)b.…

CSP-J初赛不会备考咋办?

以下备考攻略仅供参考,如需资料请私信作者!求支持! 目录 一、编程语言基础 1.语法知识 -变量与数据类型 -运算符 -控制结构 -函数 2.标准库的使用 -输入输出流 -字符串处理 -容器类(可选) 二、算法与数据结构 1.基…

使用easyexcel导出复杂模板,同时使用bean,map,list填充

背景 在使用easyexcel导出时,如果遇到一个模板中同时存在 一部分是实体类中的字段,另外部分是列表的字段,需要特殊处理一下,比如下面的模板: 这里面 user, addr 是实体类(或者map&#xff09…

Monitor 显示器软件开发设计入门二

基础篇--显示驱动方案输出接口介绍 写在前面:首先申明,这篇文章是写给那些初入显示器软件行业的入门者,或是对显示器没有基本知识的小白人员。如您是行业大咖大神,可以绕行,可看后期进阶文章。 上篇介绍了输入接口及相…

.net XSSFWorkbook 读取/写入 指定单元格的内容

方法如下&#xff1a; using NPOI.SS.Formula.Functions;using NPOI.SS.UserModel;using OfficeOpenXml.FormulaParsing.Excel.Functions.DateTime;using OfficeOpenXml.FormulaParsing.Excel.Functions.Numeric;/// <summary>/// 读取Excel指定单元格内容/// </summa…

力扣--LCR 152.验证二叉搜索树后序遍历

请实现一个函数来判断整数数组 postorder 是否为二叉搜索树的后序遍历结果。 提示&#xff1a; 数组长度 < 1000 postorder 中无重复数字代码 class Solution { public boolean verifyPostorder(int[] postorder) { if(postorder null){ return true; } return f(postor…

【electron-vite】搭建electron+vue3框架基础

一、拉取项目 electron-vite 中文文档地址&#xff1a; https://cn-evite.netlify.app/guide/ 官网网址&#xff1a;https://evite.netlify.app/ 版本 vue版本&#xff1a;vue3 构建工具&#xff1a;vite 框架类型&#xff1a;Electron JS语法&#xff1a;TypeScript &…

了解HTTPS以及CA在其中的作用

在这个信息爆炸的时代&#xff0c;每一次指尖轻触屏幕&#xff0c;都是一次数据的旅行。但您是否真正了解&#xff0c;这些数据在通往目的地的旅途中&#xff0c;是如何被保护的呢&#xff1f; HTTPS&#xff08;HyperText Transfer Protocol Secure&#xff09;是一种安全的网…

Spring Boot日志总结

文章目录 1.我们的日志2.日志的作用3.使用日志对象打印日志4.日志框架介绍5.深入理解门面模式(外观模式)6.日志格式的说明7.日志级别7.1日志级别分类7.2配置文件添加日志级别 8.日志持久化9.日志文件的拆分9.1官方文档9.2IDEA演示文件分割 10.日志格式的配置11.更简单的日志输入…

Transformer 模型:序列数据处理的自注意力神经网络架构

摘要&#xff1a; 本文全面深入地探讨 Transformer 模型&#xff0c;这一基于自注意力机制的神经网络结构在序列数据处理领域具有开创性意义。详细阐述其架构组成、自注意力机制原理、在自然语言处理等多方面的应用&#xff0c;并提供丰富的代码示例以助力读者深入理解其实现细…

docker 安装mysql8.4.0

1、拉取mysql8.4.0镜像 docker pullmysql:8.4.0-oraclelinux8查看镜像 docker images2、新建宿主机本地目录&#xff1a;用来挂载MySQL容器所产生的数据的目录 mkdir -p /home/admin/data/mysql /home/admin/logs/mysql /home/admin/conf/mysql3、在/home/admin/conf/mysql目…