当前位置:网站首页>深度学习模型与湿实验的结合,有望用于代谢通量分析
深度学习模型与湿实验的结合,有望用于代谢通量分析
2022-07-05 08:42:00 【python-码博士】
背景
在做蛋白质结构改造的道路上,需要强大的计算机编程的辅助,在深度学习领域,找到了一个强大的工具,因此研究一下如何与湿实验进行结合。
工具
DeeplearningApproach Anconda python以及各种依赖包 计算机 湿实验数据
实现思路
1.首先,配置好DeeplearningApproach,怎么配置看另一篇文章《深度学习预测酶活性参数提升酶约束模型构建从头环境搭建》。
2.利用已经有数据的突变位点进行预测,比如我要预测一个蛋白序列的L59,W60,Y153,R416位点突变为丙氨酸(A),因此我需要先配置好我的tsv文件,这里的突变我写了一个脚本,代码如下:
import copy
def sort(a,b,c,d):
for n,i in enumerate(a):
if n+1 == b: # 判断是否是我要的位点
d = a[n] # 将原序列的该位点赋予d
a = copy.deepcopy(a) # 这里需要一个深拷贝,否则会改变WT序列,当然如果是同一位点预测为其他19种氨基酸不用也可
a[n] = c # 原序列的该位点替换为我需要的位点,
i = a[n] # 提取出改变后的氨基酸
break
else:
a[n] = i
a = ''.join(a)
# print('已经将第%d位氨基酸%s改为%s,输出序列如下:%s'%((n+1),d,i,a))
print('输入底物名称 '+'输入底物化学式 '+a) # 加号与逗号的区别
def main():
# 手动输入
# while True:
# a = list(input('请输入氨基酸序列:'))
# b = int(input('请选择要改的氨基酸位点:'))
# c = input('请选择要改成的氨基酸单字母缩写:')
# sort(a,b,c,d=None)
aa_list = ['A','G','V','L','I','P','F','Y','W','S','T','C','M','N','Q','D','E','K','R','H']
pro = '输入氨基酸序列'
pro_list = []
for p in pro:
pro_list.append(p)
for i in aa_list:
sort(pro_list,231,i,d=None)
if __name__ == '__main__':
main()
3.通过提取WT,L59,W60,Y153,R416的Kcat值绘制柱形图(当然不画图用眼看也可以,就几个数据),和已有的实验数据进行比对:
深度挖掘
1)如何利用DeeplearningApproach特性?
做一个tsv文件库,这个库里包含所有该蛋白活性位点附近的氨基酸的单位点突变和双位点突变,与WT的Kcat值做对比,筛选有益突变进行实验。
2)可不可以使DeeplearningApproach更贴合某一个确切的实验,使其Kcat值更精确,然后利用Kcat做代谢通量分析,也许可以从两方面入手:
- 调整参数,以此来优化过拟合/欠拟合现象,再做一些超参数优化,使其和已有的实验结果更贴切。
- 利用实验的大量数据(至少百万条)重新训练模型,得到专一性强的模型(几乎不可能实现,只是一种猜想)
注意
本实验数据为拟造,旨在介绍方法。
边栏推荐
- Shell script
- 2022.7.4-----leetcode.1200
- Example 009: pause output for one second
- Apaas platform of TOP10 abroad
- STM32 lights up the 1.8-inch screen under Arduino IDE
- One question per day - replace spaces
- Speech recognition learning summary
- [three tier architecture and JDBC summary]
- Halcon blob analysis (ball.hdev)
- 猜谜语啦(7)
猜你喜欢
Example 005: three numbers sorting input three integers x, y, Z, please output these three numbers from small to large.
An enterprise information integration system
How apaas is applied in different organizational structures
EA introduction notes
[牛客网刷题 Day4] JZ35 复杂链表的复制
Bluebridge cup internet of things basic graphic tutorial - GPIO input key control LD5 on and off
猜谜语啦(142)
How to write cover letter?
Halcon color recognition_ fuses. hdev:classify fuses by color
Guess riddles (4)
随机推荐
[daily training] 1200 Minimum absolute difference
实例002:“个税计算” 企业发放的奖金根据利润提成。利润(I)低于或等于10万元时,奖金可提10%;利润高于10万元,低于20万元时,低于10万元的部分按10%提成,高于10万元的部分,可提成7.
[nas1] (2021cvpr) attentivenas: improving neural architecture search via attentive sampling (unfinished)
Guess riddles (142)
[three tier architecture]
C# LINQ源码分析之Count
Example 010: time to show
实例008:九九乘法表
[牛客网刷题 Day4] JZ55 二叉树的深度
实例009:暂停一秒输出
【日常训练】1200. 最小绝对差
Example 007: copy data from one list to another list.
[matlab] matlab reads and writes Excel
Reasons for the insecurity of C language standard function scanf
Sword finger offer 09 Implementing queues with two stacks
leetcode - 445. Add two numbers II
Numpy 小坑:维度 (n, 1) 和 维度 (n, ) 数组相加运算后维度变为 (n, n)
Is the security account given by Yixue school safe? Where can I open an account
696. Count binary substring
Yolov4 target detection backbone