当前位置:网站首页>深度学习模型与湿实验的结合,有望用于代谢通量分析
深度学习模型与湿实验的结合,有望用于代谢通量分析
2022-07-05 08:42:00 【python-码博士】
背景
在做蛋白质结构改造的道路上,需要强大的计算机编程的辅助,在深度学习领域,找到了一个强大的工具,因此研究一下如何与湿实验进行结合。
工具
DeeplearningApproach Anconda python以及各种依赖包 计算机 湿实验数据
实现思路
1.首先,配置好DeeplearningApproach,怎么配置看另一篇文章《深度学习预测酶活性参数提升酶约束模型构建从头环境搭建》。
2.利用已经有数据的突变位点进行预测,比如我要预测一个蛋白序列的L59,W60,Y153,R416位点突变为丙氨酸(A),因此我需要先配置好我的tsv文件,这里的突变我写了一个脚本,代码如下:
import copy
def sort(a,b,c,d):
for n,i in enumerate(a):
if n+1 == b: # 判断是否是我要的位点
d = a[n] # 将原序列的该位点赋予d
a = copy.deepcopy(a) # 这里需要一个深拷贝,否则会改变WT序列,当然如果是同一位点预测为其他19种氨基酸不用也可
a[n] = c # 原序列的该位点替换为我需要的位点,
i = a[n] # 提取出改变后的氨基酸
break
else:
a[n] = i
a = ''.join(a)
# print('已经将第%d位氨基酸%s改为%s,输出序列如下:%s'%((n+1),d,i,a))
print('输入底物名称 '+'输入底物化学式 '+a) # 加号与逗号的区别
def main():
# 手动输入
# while True:
# a = list(input('请输入氨基酸序列:'))
# b = int(input('请选择要改的氨基酸位点:'))
# c = input('请选择要改成的氨基酸单字母缩写:')
# sort(a,b,c,d=None)
aa_list = ['A','G','V','L','I','P','F','Y','W','S','T','C','M','N','Q','D','E','K','R','H']
pro = '输入氨基酸序列'
pro_list = []
for p in pro:
pro_list.append(p)
for i in aa_list:
sort(pro_list,231,i,d=None)
if __name__ == '__main__':
main()
3.通过提取WT,L59,W60,Y153,R416的Kcat值绘制柱形图(当然不画图用眼看也可以,就几个数据),和已有的实验数据进行比对:



深度挖掘
1)如何利用DeeplearningApproach特性?
做一个tsv文件库,这个库里包含所有该蛋白活性位点附近的氨基酸的单位点突变和双位点突变,与WT的Kcat值做对比,筛选有益突变进行实验。
2)可不可以使DeeplearningApproach更贴合某一个确切的实验,使其Kcat值更精确,然后利用Kcat做代谢通量分析,也许可以从两方面入手:
- 调整参数,以此来优化过拟合/欠拟合现象,再做一些超参数优化,使其和已有的实验结果更贴切。
- 利用实验的大量数据(至少百万条)重新训练模型,得到专一性强的模型(几乎不可能实现,只是一种猜想)
注意
本实验数据为拟造,旨在介绍方法。
边栏推荐
猜你喜欢
EA introduction notes
Halcon color recognition_ fuses. hdev:classify fuses by color
Agile project management of project management
leetcode - 445. Add two numbers II
猜谜语啦(11)
Old Wang's esp8266 and old Wu's ws2818 light strip
Guess riddles (10)
剑指 Offer 05. 替换空格
Low code platform | apaas platform construction analysis
[nas1] (2021cvpr) attentivenas: improving neural architecture search via attentive sampling (unfinished)
随机推荐
Mathematical modeling: factor analysis
Esp8266 interrupt configuration
Bluebridge cup internet of things basic graphic tutorial - GPIO output control LD5 on and off
Halcon wood texture recognition
Reasons for the insecurity of C language standard function scanf
Guess riddles (9)
js异步错误处理
Shell script
[daily training -- Tencent selected 50] 557 Reverse word III in string
猜谜语啦(7)
实例002:“个税计算” 企业发放的奖金根据利润提成。利润(I)低于或等于10万元时,奖金可提10%;利润高于10万元,低于20万元时,低于10万元的部分按10%提成,高于10万元的部分,可提成7.
Sword finger offer 06 Print linked list from end to end
Sword finger offer 09 Implementing queues with two stacks
实例005:三数排序 输入三个整数x,y,z,请把这三个数由小到大输出。
关于线性稳压器的五个设计细节
2020-05-21
[nas1] (2021cvpr) attentivenas: improving neural architecture search via attentive sampling (unfinished)
How can fresh students write resumes to attract HR and interviewers
Business modeling | process of software model
Example 009: pause output for one second