当前位置:网站首页>学习基因富集工具DAVID(3)
学习基因富集工具DAVID(3)
2022-08-02 21:51:00 【黄思博呀】
Gene Ontology(GO)分析
GO分析,在MF、BP、CC三方面富集基因,分析在三方面的功能注释内,基因富集的P Value
使用DAVID实现GO分析:
其实操作和实现KEGG pathways分析类似
GO分析得到的txt文件:
每一行是一条条目(term)
Category列,或者说Ontology列:
共有分为CC、BP、MF三类
对应基因的细胞组分,生物学过程和分子功能三类
Term列:
基因在GO库内记录的号码和相关功能的注释
BgRatio :
背景比率分数,分母是该物种编码蛋白的基因中凡是带有GO注释的gene的总数(估计就是GO基因库总数),分子是总数内带有当前条目上GO功能注释的基因数目。
GeneRatio:
分母是实验用到的基因总数(进行GO分析的基因数目),分子是分母基因内富集到这个GO注释的基因数量。
富集倍数:
假设BgRatio是200/20000=0.01,而GeneRatio是10/100=0.1,那么富集倍数就是0.1/0.01=10倍。
P value,以及进行FDR校正是p.adjust
GO富集分析:条形图和气泡图
利用进行负对数处理的P值为X轴,和条目的GO注释(Y轴)绘制统计柱形图,若是条柱越长,该条目基因的富集效果越显著。
利用下载的go分析数据绘制气泡-颜色映射图:
一个X-Y二维图,加上符号大小和颜色映射,实现在平面内表达四维数据。
用Excel处理下载的GO数据文件:
1.处理功能注释term列 :
若Term列为B列
新建一列,输入=right(B2,LEN(B2)-11) & "[BP]"
下拉填充
2.按Category列进行排序(将混乱的MF、CC、BP进行整理)
3.筛选出PValue<0.01的条目:
选择PValue列
点击[排列和筛选]-->[筛选]-->在PValue列出现的三角按钮选择[数字筛选] \
-->选择小于0.01
选取BP、CC、MF中Pvalue显著的前10列进行绘图
选取Fold enrichment、新的Term列、Count列和PValue列做为一个新四维数据,复制到Origin里
在Origin里绘制气泡-颜色映射图:
选择【绘图】-->【类别】-->【气泡+颜色映射图】,打开如下的弹窗:
① 用Fold enrichment列为X轴,Term列为Y轴,Count列表示符号大小(气泡大小)S维度,Pvalue为颜色映射 C维度,点击确定。
添加色阶图例:
选择①图-->②图例-->③重构图例,在图内弹出一个新图例:
对图内弹出的图例①右键,选择②【添加色阶】,删除原图例
对画布进行调整、字体进行调整,添加图例等操作,保存图片:
参考文章和视频:
边栏推荐
猜你喜欢
随机推荐
面试官:可以谈谈乐观锁和悲观锁吗
group of people
牛客刷题:数组排序
Yocto系列讲解[实战篇]85 - 制作ubi镜像和自动挂载ubifs文件系统
go context 包
Redis是如何轻松实现系统秒杀的?
创建型模式 - 简单工厂模式StaticFactoryMethod
UDP(用户数据报协议)
SSM整合步骤(重点)
Add and delete all these years, finally planted in MySQL architecture design!
牛客刷题:手动实现数组filter方法
牛客每日刷题之链表
go 反射 reflect 包
Task 4 Machine Learning Library Scikit-learn
Finally understand: With threads, why do we need coroutines?
In-depth study TypeScript TypeScript 】 【 class (under)
RuoYi-App Startup Tutorial
双轴晶体中的锥形折射
Word2Vec词向量训练、使用及可视化操作
万物智联时代,悄然走入生活