当前位置:网站首页>深度学习模型与湿实验的结合,有望用于代谢通量分析

深度学习模型与湿实验的结合,有望用于代谢通量分析

2022-07-05 08:42:00 python-码博士

背景

在做蛋白质结构改造的道路上,需要强大的计算机编程的辅助,在深度学习领域,找到了一个强大的工具,因此研究一下如何与湿实验进行结合。

工具

DeeplearningApproach Anconda python以及各种依赖包 计算机 湿实验数据

实现思路

1.首先,配置好DeeplearningApproach,怎么配置看另一篇文章《深度学习预测酶活性参数提升酶约束模型构建从头环境搭建》。
2.利用已经有数据的突变位点进行预测,比如我要预测一个蛋白序列的L59,W60,Y153,R416位点突变为丙氨酸(A),因此我需要先配置好我的tsv文件,这里的突变我写了一个脚本,代码如下:

import copy

def sort(a,b,c,d):
    for n,i in enumerate(a):
        if n+1 == b:   # 判断是否是我要的位点
            d = a[n]   # 将原序列的该位点赋予d
            a = copy.deepcopy(a)   # 这里需要一个深拷贝,否则会改变WT序列,当然如果是同一位点预测为其他19种氨基酸不用也可
            a[n] = c   # 原序列的该位点替换为我需要的位点,
            i = a[n]   # 提取出改变后的氨基酸
            break
        else:
            a[n] = i
    a = ''.join(a)
    # print('已经将第%d位氨基酸%s改为%s,输出序列如下:%s'%((n+1),d,i,a))

    print('输入底物名称 '+'输入底物化学式 '+a) # 加号与逗号的区别
    
def main():
    # 手动输入
    # while True:
    # a = list(input('请输入氨基酸序列:'))
    # b = int(input('请选择要改的氨基酸位点:'))
    # c = input('请选择要改成的氨基酸单字母缩写:')
        # sort(a,b,c,d=None)

    aa_list = ['A','G','V','L','I','P','F','Y','W','S','T','C','M','N','Q','D','E','K','R','H']
    pro = '输入氨基酸序列'
    pro_list = []
    for p in pro:
        pro_list.append(p)
    for i in aa_list:
        sort(pro_list,231,i,d=None)


if __name__ == '__main__':
    main()

3.通过提取WT,L59,W60,Y153,R416的Kcat值绘制柱形图(当然不画图用眼看也可以,就几个数据),和已有的实验数据进行比对:


实验数据

深度学习预测数据
4.从结果看,拟合的并不是很好,但是在大方向上没有问题,Kcat小于WT的实际也小,大于WT的实际也大。(当然数据量很少,并不能说明问题,预测出来的结果只能去尝试) 5.通过将A231位点突变为其他19种氨基酸(还是用上面的代码配置的tsv文件),预测结果显示A231G的Kcat值比WT大,也许可以尝试一下,或者突变其他位点找到Kcat值大于R416A的突变去尝试一下。 ![在这里插入图片描述](//img.inotgo.com/imagesLocal/202207/05/202207050841506678_1.png)

预测A231位点突变为其他19种氨基酸

深度挖掘

1)如何利用DeeplearningApproach特性?
做一个tsv文件库,这个库里包含所有该蛋白活性位点附近的氨基酸的单位点突变和双位点突变,与WT的Kcat值做对比,筛选有益突变进行实验。
2)可不可以使DeeplearningApproach更贴合某一个确切的实验,使其Kcat值更精确,然后利用Kcat做代谢通量分析,也许可以从两方面入手:

  • 调整参数,以此来优化过拟合/欠拟合现象,再做一些超参数优化,使其和已有的实验结果更贴切。
  • 利用实验的大量数据(至少百万条)重新训练模型,得到专一性强的模型(几乎不可能实现,只是一种猜想)

注意

本实验数据为拟造,旨在介绍方法。

原网站

版权声明
本文为[python-码博士]所创,转载请带上原文链接,感谢
https://blog.csdn.net/m0_54634272/article/details/125590959