当前位置:网站首页>数据分析-启动子进化分析
数据分析-启动子进化分析
2022-06-28 12:55:00 【小胡子刺猬】
启动子的重要性
启动子是RNA 聚合酶识别、结合和开始转录的一段DNA 序列,它含有RNA 聚合酶特异性结合和转录起始所需的保守序列,多数位于结构基因转录起始点的上游,启动子本身不被转录。但有一些启动子(如tRNA启动子)位于转录起始点的下游,这些DNA序列可以被转录。启动子的特性最初是通过能增加或降低基因转录速率的突变而鉴定的。启动子一般位于转录起始位点的上游。启动子位于结构基因5'端上游的DNA序列,能活化RNA聚合酶,使之与模板DNA准确的结合并具有转录起始的特异性。启动子本身并不控制基因活动,而是通过与称为转录(transcription)因子的这种蛋白质(proteins)结合而控制基因活动的。转录因子就像一面"旗子",指挥着酶(enzymes)(RNA聚合酶polymerases) 的活动。
启动子序列的提取
一般要进行启动子进化分析,都是在已知某一大类的基因是在CDS区比较保守 的,因此想查看在启动子区是否有同样的情况,因此首先需要对物种进行选取,以wrky家族为例,可以现在ensemble plant网站上进行预测,查看不同的物种之间的进化关系。
在搜索后,可以点击左边的基因树,查看基本的进化关系。
可以选取wrky基因进化比较近的物种进行启动子序列的提取。
在网页上点击每个node可以导出启动子序列,已知基因号和物种信息后,提取主要还是在ensembel网站上进行。
主要是在biomart上进行提取,先选择物种信息后,在filters里面gene选择自己要的几个基因,在attributes里选择sequence,然后点击sequence,选择flank(gene),点击upstrean 1000,然后点击count,查看result的结果,如果需要下载,点击go。
上面的这些提取内容在phytozome上也可以,也是在biomart下面进行一样的操作。
启动子motif分析
前面已经得到了多个物种的启动子序列,然后我们选用tbtools的fasta merge进行序列的合并,得到全部的fa文件。
进行motif分析,主要是选用MEME网站上的meme分析,我选用的是10个motif,然后在advance中将每个motif的序列最短设置为15个碱基。
做启动子motif分析的主要目的查看这些启动子的序列中是不是有些位点是与我们研究的某些特殊的信号转导的基因有关,为前面的实验结果进行佐证。
启动子顺式作用元件分析
对顺式作用元件分析的时候,主要选用的是plantcare网站,由于我这次做分析的时候没有关注这个问题,但是如果需要做的话,网页上有很多相关的教程,可以按照教程走,然后得到很多的顺式作用元件,后面就是根绝自己关注的重点,进行挑选。
启动子进化树构建
进化分析也是选用的常用的MEGA软件进行分析。
首先是进行碱基序列的比对,我选用的的muscle的模型进行比对,比对后截去5'端和3'端与其他序列差异较长的碱基,然后输出mega序列。
随后进行进化树的构建,先用模型进行最优搜索,然后进行ML进化树构建,一般是选用的500bootstrap。
得到后,输出netwrik文件,可以在figtree或者itol上进行美化。
总结
进行启动子进化分析的时候,一个重点是需要知道自己研究的这一类基因在进化上的保守性,因为后面的内容基本都是依托于同源性进行分析的,如果同源性太低,后面的结果也是不太准确的。基于以上的结果,还可以做一些基因的演化、物种内/间的共线性分析/WGD情况,这些主要是根据自己的研究内容往下挖,由于我们目前只关注这些,所以我只做了这一部分内容。
边栏推荐
- 几百行代码实现一个 JSON 解析器
- Microservice stability guarantee
- Matplotlib_Study01
- ASP.NET CORE Study08
- Go language learning notes - Gorm usage - database configuration, table addition | web framework gin (VII)
- pytorch模型调参、训练相关内容
- ##测试bug常用“Redmine”
- 性能测试-01-简介
- MySQ 8.0 推出直方图,性能大大提升!
- newest! Introduction and practical tutorial of point cloud processing based on open3d
猜你喜欢

从pdb源码到frame帧对象

Xiaobai's e-commerce business is very important to choose the right mall system!
JS class is not just a simple syntax sugar!

腾讯汤道生:面向数实融合新世界,开发者是最重要的“建筑师”

$100000 AI competition: the task of finding "worse" big models

分页样式 flex设置成在尾部显示(即使页数加长 也不会因为在末尾而换行)

如何在Microsoft Exchange 2010中安装SSL证书

【MySQL从入门到精通】【高级篇】(三)MySQL用户的创建_修改_删除以及密码的设置

腾讯确认QQ大规模盗号,iPhone14无缘Type-C,第四大运营商5G正式放号,今日更多大新闻在此...

SHAREit實力出眾,登陸全球 IAP 實力榜 Top7
随机推荐
为什么CAD导出PDF没有颜色
Can ArcGIS Pro directly connect PostgreSQL and edit layer elements
SHAREit實力出眾,登陸全球 IAP 實力榜 Top7
go template with...end遍历用法
ASP. NET CORE Study04
manjaro easyconnecy报错:libgtk-x11-2.0.so.0: cannot open shared object file: No such file or directory
我的NVIDIA开发者之旅-Jetson Nano 2gb教你怎么训练模型(完整的模型训练套路)
中二青年付杰的逆袭故事:从二本生到 ICLR 杰出论文奖,我用了20年
How to handle the safest account opening when downloading the mobile app of Huatai Securities
ASP.NET CORE Study03
k3s一键安装脚本
Ipetronik data acquisition equipment and softing q-vision software are committed to ADAS test scheme
fastposter v2.8.4 发布 电商海报生成器
企业源代码保密方案分享
[MySQL from introduction to mastery] [advanced part] (III) creation of MySQL users_ Modification_ Delete and password settings
My NVIDIA developer tour -jetson nano 2GB teaches you how to train models (complete model training routines)
Watermaker of the Flink core
How to install SSL certificates in Microsoft Exchange 2010
Wi-Fi 7 来啦,它到底有多强?
Centos6.5 php+mysql MySQL library not found