爱基百客云平台小工具——时序分析使用教程目录
1 爱基百客云平台之时序分析
2 参数设置
3 任务查看
4 结果
01
爱基百客云平台小工具使用
首先,打开爱基百客官网:http://www.igenebook.com;点击菜单栏最右侧“云平台”按钮。
弹出云平台界面(下图),输入账号、密码和验证码方可登录;进入云平台,可以轻松实现多种组学数据的分析和可视化,实现真正的“零代码、无门槛、操作简单”!
登陆后,如下图,我们进入到小工具专栏。当前云平台已上线了31款小工具供大家使用,包括基础绘图,高级绘图,差异检验,聚类分析,序列处理等子模块,本着用户至上的理念,平台小工具将会持续更新维护,积极接受用户的反馈和意见。
1.1
爱基百客云平台之时序分析
在转录组数据分析过程中,我们最常做的是不同处理方式的样本之间的比较(Treated vs Control),这时候我们采用“DEG分析+pathway分析”的方式就可基本完成对数据的分析,但有时会获得不同时间点处理或者发育时间线,亦或是疾病进展不同时期的基因表达水平。这时候,单纯的差异分析只能进行两两组别之间的对比,找出差异基因或者基因集。不足以满足研究整个生物学过程的动态调控。基于此,表达时序分析可以帮助研究者理解基因在时间轴上的表达动态变化,揭示基因调控的动态性和复杂性。通过分析基因在不同时间点上的表达水平变化,可以识别关键的调控因子和信号通路,深入探索基因调控的动态机制。
时序分析的核心算法是基于模糊c均值聚类(Fuzzy C-Means Clustering,FCM)。
1. 模糊C均值聚类:不同于Kmeans或其他聚类方法,Mfuzz 提供了用于执行模糊C均值聚类的函数,可以将基因表达数据分成具有相似表达模式的基因簇。
2. 特征选择:Mfuzz 可以帮助研究者从聚类结果中识别出具有显著表达模式的基因,进行特征选择和功能富集分析。
3. 可视化工具:Mfuzz 包含了可视化工具,如热图和聚类图,可以直观展示聚类结果和基因表达模式。
下面我们以时序分析为例进行实操练习。
首先点击小工具时序分析
右侧的工具介绍和常见问题对时序分析小工具进行的主要用途,使用方法以及结果解读做了详细的说明。左侧是必要的输入文件和参数选项。任务名称和任务编号系统会自动生成。后面可用于记录查看具体的任务。小工具提供了示例文件给用户做测试分析。同时,该页面还提供了一些常用参数调节选项。聚类数提供了常见数目的选项,线条颜色有默认值,您也可进行自定义,后面将详细介绍。输出名自定义,默认result。
1.2
参数设置
输入文件:支持txt(制表符分隔)文本文件,以及Excel专用的xlsx格式,同样支持旧版Excel的xls(Excel 97-2003 )格式。
表达数据文件之间需用制表符(Tab键)分隔,第一行为表头信息,第一列为gene或蛋白名,其余每个样本一列。如下表所示:
分组文件包含两列,第一列是样本名,第二列是组名。样本需按照时间点从上往下排。如下表所示:
如果文件已经上传过,您可以直接点击选择按钮找到需要的文件勾选确定,无须再次上传。
聚类群数目可以逐一尝试去评估。如果您看到有些聚类群的折线图在外观上比较相似,它们大致反映了同一种时间趋势时,表明存在冗余的聚类群,可能意味着需减少聚类群数量。如果您看到有些聚类群的折线图内的折线并不整齐,波动幅度过大,或者出现了多个密度中心,可能意味着需增加聚类群数量。多次尝试后,再结合实际情况,挑选出感觉最合适的那个出来。
时序分析可视化图提供了默认配色。如需要自定义配色,时序分析需要填入包含多个颜色的色系,例如可填写”#F87400_Yellow_OliveDrab1”更换配色。
取色器每次能取一种颜色,颜色输入值为多个时,将挑选好的颜色组合,中间用下划线分隔,填入颜色参数方格中。
输出名自定义即可。
填写好上述所有的参数后,点击提交即可。
1.3
任务查看
您可在任务管理栏中查看任务的运行情况和结果。默认情况下新任务将会在最上方展示,也可通过任务名、任务编码、日期点击查询,找到需要的任务。如下图:当状态成功时,表示任务成功结束。
点击下载按钮可直接打包下载全部结果。点击查看按钮可在线查看结果。
您可在在线查看结果后选择是否下载保存。另外如果结果较多时,结果展示区还可通过点击左侧或右侧的箭头进行图片切换。您可挑选自己感兴趣的结果图片进行下载保存。
1.4
结果
输出结果包含时序分析图pdf/png,支持矢量图和位图图片格式下载。
换颜色试试。如使用上面的示例颜色”#F87400_Yellow_OliveDrab1”
大家可根据自己的喜好选择不同的色系进行配色。
结果部分同时包含时序分析聚类统计表。表格包含基因名,所属聚类群,以及对应的membership。membership指的是数据点属于每个聚类的程度,通常用一个0到1之间的值表示,表示该数据点与每个聚类中心的相似程度。其它列为标准化后的样本表达结果。
您可基于该结果做进一步的数据挖掘和可视化。如可将每一个聚类结果基因集做进一步的富集分析找到可能发挥作用的pathway。爱基百客云平台也提供了富集分析小工具,可实现从时序分析 + 聚类基因集富集一站式完成。