MSigDB数据库 | 富集分析需要的基因集该去哪里找?如何选择适合自己数据的基因集?

富集分析可以说是我们的老帮手了!进行富集分析,就不能不提基因集,那基因集我们该去哪里找呢?我们又该如何选择适合自己数据的基因集呢?咱们今天就来浅浅唠一唠!

最常见的操作就是去MSigDB数据库找现成的基因集,当然也可以自定义基因集,那既然有现成的,我们为什么还要多此一举去自定义呢?因为呀,总会有新发现的基因集或其它感兴趣的基因的集合对不对,甚至有些物种没有现成的基因集,我们只能自制,所以在之后我会教大家怎么制作自定义基因集,有需求的小伙伴们也可以催催我哈哈哈哈哈哈哈哈哈哈哈哈!!!

MSigDB数据库

**MSigDB(Molecular Signatures Database)**是一个汇集了经过良好注释的基因集合的数据库,被广泛用于分析基因富集通路。我们在之前的看完还不会来揍我 | GSEA富集分析详解(一)—— 代码实操中也对其进行过简单介绍。

官网链接:https://www.gsea-msigdb.org/gsea/msigdb/index.jsp

在MSigDB的官网上,我们可以通过关键字搜索基因集、按名称或集合浏览基因集、查看基因集及其注释、下载基因集、计算我们提供的基因集与MSigDB中的基因集之间的重叠、按基因家族对基因集的成员进行分类以及在提供的公共表达概要中查看基因组的表达谱等等。不仅如此,我们还可以调查在线生物网络存储库NDEx中的基因集。

官网页面如下:

我们可以看到它包含人类和小鼠的基因集,数据库一直处于更新中,最新版本就像上图展示的那样,我们今天就先重点介绍人类基因集,它们被划分为9个大类,包括**H(hallmarker gene sets)、C1(positional gene sets)、C2(curated gene sets)**等等。我们接下来就具体介绍一下这9大基因集,方便大家判断自己的数据更适合使用哪些基因集进行富集分析(当然也可以自定义基因集,也就是新发现的基因集或其它感兴趣的基因的集合,甚至有些物种没有现成的基因集,我们只能自制,所以在之后我会教大家怎么制作自定义基因集,有需求的小伙伴们也可以催催我哈哈哈哈哈哈哈哈哈哈哈哈)。

这里我只能略微详细介绍啦,想更进一步了解的小伙伴们,MSigDB当前最新版本详情大家可以在https://docs.gsea-msigdb.org/#MSigDB/Release_Notes/MSigDB_2023.2.Hs/进行查看。

  1. H(hallmarker gene sets): Hallmark基因集总结并代表了特定的明确定义的生物状态或过程,它包含由多个已知的基因集构成的超级基因集,每个H类别的基因集都对应多个基础的其他类别的基因集,较为常用。我们可以详细查看一下!按照下面的步骤依次点进去!

    我们以第一个脂肪生成为例,点击后会出现如下界面,里面会包含这个基因集的简介、所包含的相关的基因集信息、以及与此基因集相关的200个基因信息等等。

    后面的几个大类我就不这么一个一个点进去了哈,大家自行操作!

  2. C1(positional gene sets): 与基因在染色体上的位置相关的基因集合,根据不同染色体编号进行二级分类,不太常用,感觉性别相关研究可能会用到。

  3. C2(curated gene sets): 包含已知数据库、文献和专家支持的基因集信息,每个基因集的基因集页面会列出其来源。C2集合分为以下两个子集合:化学和遗传扰动 (CGP,chemical and genetic pertubations) 和规范通路 (CP,canonical pathways)。

  4. C3(regulatory target gene sets): 代表转录因子或microRNA调控潜在靶标的基因集。些集合由按它们在非蛋白质编码区域中共享的元素分组的基因组成。这些元件代表启动子和3’-UTR中已知或可能的顺式调节元件。C3集合分为两个子集合:microRNA靶基因(MIR,microRNA targets)和转录因子靶基因(all transcription factor targets)。

  5. C4(computational gene sets): 通过挖掘大量面向癌症的表达数据来定义的计算基因集。C4集合现阶段(它更新蛮快的嘛!上次看才俩!)分为三个子集合:3CA(Curated Cancer Cell Atlas)、CGN(cancer gene neighborhoods)和CM(cancer modules)。

  6. C5(ontology gene sets): 包含由相同本体术语注释的基因的基因集。C5集合分为两个子集合,第一个来自基因本体资源(GO,Gene Ontology),其中包含BP、CC和MF组件;第二个来自人类表型本体(HPO,Human Phenotype Ontology)。

  7. C6(oncogenic signature gene sets): 代表通常在癌症中失调的细胞通路特征的基因集。大多数特征直接来自 NCBI GEO 的微阵列数据或来自内部未发表的涉及已知癌症基因扰动的分析实验。

  8. C7(immunologic signature gene sets): 代表免疫系统内细胞状态和扰动的基因集。

  9. C8(cell type signature gene sets):包含针对人类组织单细胞测序研究中确定的细胞类型的精选簇标记的基因集。

以上就是关于这几个基因集的介绍啦!下载使用的话需要注册账号,很简单的!不要担心!

那我们就以C6为例向大家介绍基因集的具体下载过程!

基因集下载

首先我们进入官网后,依次按照下图所示方式操作即可!

可以下载整个基因集,也可以下载单个通路的基因集进行分析。一般我们最常用的就是gmt格式,还有图中可以看到,有Gene Symbols、NCBI (Entrez) Gene IDs等等,大家要依据自己的数据情况进行选择。


那今天的分享就到这里啦!我们下期再见哟!

最后顺便给自己推荐一下嘿嘿嘿!

如果我的分享对你有用的话,欢迎关注点赞在看转发分享阿巴阿巴阿巴阿巴巴巴!这可是我的第一原动力!

蟹蟹你们的喜欢和支持!!!

啊对!如果小伙伴们有需求的话,也可以加入我们的交流群:一定要知道 | 永久免费的生信交流群终于来啦!

还有兴趣的话,也可以看看我掏心掏肺的干货满满 | 给生信小白的入门小建议 | 掏心掏肺版!绝对干货满满!

如果有小伙伴对付费分析有需求的话,可以看看这里:个性化科研服务 | 付费分析试营业正式启动啦!定制你的专属生信分析!可提供1v1答疑!

入群链接后续可能会不定期更新,主要是因为群满换码或是其他原因,如果小伙伴点开它之后发现,咦,怎么失效啦!不要慌!咱们辛苦一下动动小手去主页的要咨询那里,点击进交流群即可入群!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/450592.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

2024-3-11-C++作业

1>试编程 要求&#xff1a; 提示并输入一个字符串&#xff0c;统计该字符中大写、小写字母个数、数字个数、空格个数以及其他字符个数 源代码: #include <iostream>using namespace std;int main() {string s;cout << "请输入字符串&#xff1a;"…

RESTful接口规范参考

介绍 REST&#xff08;Representational State Transfe&#xff09;&#xff0c;一种架构设计风格&#xff0c;而不是强制标准&#xff0c;主要用于客户端与服务端接口规范&#xff1b;在现代的软件开发中&#xff0c;RESTful API已经成为应用程序之间通信的重要桥梁&#xff…

淘宝扭蛋机小程序开发:惊喜与趣味,尽在一扭之间

随着移动互联网的快速发展&#xff0c;小程序作为一种轻量级、便捷的应用形式&#xff0c;受到了广大用户的青睐。为了满足淘宝用户对新鲜、有趣购物体验的需求&#xff0c;我们倾力打造了淘宝扭蛋机小程序&#xff0c;为用户带来全新的购物乐趣和惊喜体验。 淘宝扭蛋机小程序…

【JavaScript标准内置对象】Math的介绍。

简言 js与其他高级语言一样&#xff0c;也可以进行数学运算。 Math 是一个内置对象&#xff0c;它拥有一些数学常数属性和数学函数方法。Math 不是一个函数对象。 Math 用于 Number 类型。它不支持 BigInt。 Math 与其他全局对象不同的是&#xff0c;Math 不是一个构造器。Ma…

CANalyzer使用_02 测试环境搭建

本文主要介绍CANalyzer测试环境的搭建。主要是硬件方面&#xff0c;软件方面要跟着进行配合。根据ISO 11898标准&#xff0c;如果是高速&#xff0c;记得要加120Ω的终端电阻。 1 两个CAN短接 如下图所示&#xff0c;用两端都是DB9的线将VN1630A的CH1和CH2的端口短接。VN1630…

SpringSecurity 快速入门

文章目录 1. 认证授权概述1.1 认证授权概念1.1.1 认证1.1.2 授权 1.2 权限数据模型1.3 RBAC权限模型1.3.1 介绍1.3.2 基于角色访问控制1.3.3 基于资源访问控制 1.4 常见认证方式1.4.1 Cookie-Session1.4.2 jwt令牌无状态认证 1.5 技术实现 2. SpringSecurity入门2.1 介绍2.2 入…

人数统计显示屏对粉尘车间人员进出管理

2022年1月20日&#xff0c;江苏省常州市某公司的粉尘车间发生了一起严重的粉尘爆炸事故&#xff0c;这一悲剧造成了8人死亡和8人受伤。这起事故引起了社会各界的广泛关注&#xff0c;也再次凸显了工业安全管理的重要性。 据报道&#xff0c;这起粉尘爆炸事故发生在公司的粉尘车…

ModuleNotFoundError: No module named ‘serial.tools‘

解决以上报错的方法&#xff1a; 1、大家在使用以下代码时&#xff1a; port_list list(serial.tools.list_ports.comports()) 会出现报错&#xff1a; ModuleNotFoundError: No module named serial.tools; serial is not a package 这个时候我们应该先安装serial 然…

Spring Boot整合zxing实现二维码登录

zxing是google的一个二维码生成库&#xff0c;使用时需配置依赖&#xff1a; implementation("com.google.zxing:core:3.4.1") implementation("com.google.zxing:javase:3.4.1") zxing的基本使用 我们可以通过MultiFormatWriter().encode()方法获取一个…

PMP考试:如何高效学习PMBOK?

PMBOK&#xff08;项目管理知识体系指南&#xff09;是PMP考试的核心教材&#xff0c;学习PMBOK对于备考PMP考试至关重要。那么我将分享一些高效学习PMBOK的方法和技巧&#xff0c;帮助同学们更好地掌握项目管理知识。 一、制定学习计划 在学习PMBOK之前&#xff0c;制定一个详…

嵌入式系统中端口号的理解与分析

每当看到有人的简历上写着熟悉 tcp/ip, http 等协议时, 我就忍不住问问他们: 你给我说说, 端口是啥吧! 可惜, 很少有人能说得让人满意... 所以这次就来谈谈端口(port), 这个熟悉的陌生人. 在此过程中, 还会谈谈间接层, naming service 等概念, IoC, 依赖倒置等原则以及 TCP 协议…

【linux】02 :Linux基础命令

1.掌握linux系统的目录结构 linux只有一个顶级目录&#xff0c;称之为&#xff1a;根目录。 windows系统有多个顶级目录&#xff0c;即各个盘符。 2.linux路径的描述方式 /在Linux中的表示&#xff1a;出现在开头表示根目录&#xff0c;出现在后面表示层级关系。 3.什么是命…

项目管理工具及模板(甘特图、OKR周报、任务管理、头脑风暴等)

项目管理常用模板大全&#xff1a; 1. 项目组OKR周报 2. 项目组传统周报工作法 3. 项目甘特图 4. 团队名单 5. 招聘跟进表 6. 出勤统计 7. 年度工作日历 8. 项目工作年计划 9. 版本排期 10. 项目组任务管理 11. 项目规划模板 12. 产品分析报告 13. 头脑风暴 信息化项目建设全套…

vuetify3+vite,打包后mdi图标无法正常显示,及打包后首页白屏

1、图标无法正常显示 【因为我的vite.config.ts配置中使用了vite-plugin-css-injected-by-js这个插件】 为了优化我的项目&#xff0c;我使用了很多插件&#xff0c;vite-plugin-css-injected-by-js就是其中一个&#xff0c;项目本地运行是正常的&#xff0c;但是当我使用unia…

【梳理】k8s使用Operator搭建Flink集群(高可用可选)

文章目录 1. 架构图2. helm 安装operator3. 集群知识k8s上的两种模式&#xff1a;Native和Standalone两种CR 4. 运行集群实例Demo1&#xff1a;Application 集群Demo2&#xff1a;Session集群优劣 5. 高可用部署问题1&#xff1a;High availability should be enabled when sta…

【LeetCode】升级打怪之路 Day 18:二叉树题型 —— 树的深度、高度、路经

今日题目&#xff1a; 104. 二叉树的最大深度111. 二叉树的最小深度110. 平衡二叉树257. 二叉树的所有路径112. 路径总和 目录 Problem 1&#xff1a;树的深度LC 104. 二叉树的最大深度 【easy】LC 111. 二叉树的最小深度 【易错】 Problem 2&#xff1a;树的高度LC 110. 平衡二…

【阿里云系列】-如何实现两个VPC网络资源互通

背景 由于实际项目预算有限&#xff0c;两套环境虽然分别属于不同的专有网络即不同的VPC&#xff0c;但是希望借助一台运维机器实现对两个环境的监控和日常的运维操作 网络架构 如下是需要实现的外网架构图&#xff0c;其中希望实现UAT环境的一台windows的堡垒机可以访问生产…

如何考上东南大学计算机学院?

东南大学招生学院是计算机科学与工程学院、苏州联合研究生院&#xff0c;复试公平&#xff0c;不歧视双非考生&#xff0c;985院校中性价比较高&#xff0c;但近年热度在逐年上涨&#xff0c;需要警惕。 建议报考计算机科学与工程学院081200计算机科学与技术专业目标分数为380…

HarmonyOS开发:NEXT版本开发新体验

前言 年前&#xff0c;公司团队接洽了鸿蒙方团队&#xff0c;确认了生态合作&#xff0c;于是开通了白名单权限&#xff0c;授权了新的IDE和相关文档的使用和查看&#xff0c;历经一月有余&#xff0c;谈谈NEXT版本有哪些开发上的区别。 本文会从以下几个方面阐述&#xff1a;…

Unity2021.3.35f1配置安卓APK发布环境

1.在Unity3d中点击菜单【Edit】【Preferences】&#xff0c;在External Tools中可以看到Android平台需要配置JDK、SDK、NDK、Gradle。对应的版本需要在官方文档中查看 JDK&#xff1a;指Java开发环境 SDK&#xff1a;指安卓开发包&#xff0c;包括Build Tools、Commond-line T…