RNA-seq数据GSEA富集分析

本文描述了bulk RNA-seq分析流程中GSEA(Gene Set Enrichment Analysis)富集子模块,该模块可以得到排序基因列表在基因集中的富集情况,可用来评估特定的基因集与表型或处理之间的关联性。

分析流程示意图

进行GSEA分析至少需要两个输入文件:(1)全基因组基因排序文件。一般可以根据差异表达分析的P-value来排序,当样本数比较少的时候,可以根据表达变化Log2 Flold-change来排序。(2)基因集。可以自定义,也可以从MSigDB数据库提取。

Drawing

数据导入

准备gene rank文件

准备CHIP文件

准备基因集(gene set)

运行GSEA

GSEA运行会产生report文件,是网页的形式,非常直观,其中的图可以直接用于文章的发表。

Drawing

格式转换

这个图示PNG格式,网上有个很方便的工具将分析的结果转成PDF高清格式。

重新产生的图是PDF格式的,可以使用Adobe Illustrator编辑。