当前位置:网站首页>Almost all known protein structures in the world are open sourced by DeepMind
Almost all known protein structures in the world are open sourced by DeepMind
2022-08-04 14:14:00 【Python data】
机器之心报道
编辑:陈萍、小舟、泽南
Almost all protein structures known to science,都在这里了.
蛋白质是生命的基础构件,它们由氨基酸链组成,折叠成不同的复杂形状.蛋白质的功能通常由其 3D 结构决定.如果我们了解蛋白质的折叠方式,就可以开始探索它们是如何工作的,并尝试改变它们的功能.尽管 DNA 提供了制造氨基酸链的指令,但预测它们如何相互作用以形成蛋白质的 3D 结构是一个巨大的挑战.
一年前,DeepMind 发布了 AlphaFold2,以原子水平的准确度预测了 2/3 的蛋白质结构,并与 EMBL-EBI 共同发布了开放可搜索的蛋白质结构数据库 AlphaFold DB,与世界共同分享这一技术.
7 月 28 日,DeepMind 宣布 AlphaFold DB 已从 100 万个结构扩展到超过 2 亿个结构,扩大超过 200 倍,这一进展将极大地提升人们对于生物学的理解.
几乎涵盖所有已知蛋白质
「你可以认为它基本涵盖了所有蛋白质结构.包括植物、细菌、动物和许多其他生物的预测结构,这为 AlphaFold 开辟了巨大的新机会,可以对环保、粮食安全和被忽视疾病等重要问题产生影响,」DeepMind 创始人、首席执行官杰米斯 · 哈萨比斯在介绍 AlphaFold DB 这次扩展时说道.
这一更新包括植物、细菌、动物和其他生物的蛋白质预测结构.
这一更新意味着蛋白质数据库 UniProt 都将带有蛋白质预测结构(UniProt 是一个全面的,高质量的,免费使用的蛋白质序列与功能信息数据库,它还包含了大量来自研究文献的关于蛋白的生物学功能信息).研究者可以通过 Google Cloud Public Datasets 批量下载,让世界各地的科学家更容易访问 AlphaFold.
斯克里普斯转化研究所创始人 Eric Topol 表示:「AlphaFold 是生命科学领域独一无二的重大进步,展示了 AI 的力量.过去确定蛋白质的 3D 结构需要数月或数年,现在只需几秒钟.AlphaFold 已经加速并实现了大规模发现,包括破解核孔复合体的结构.新的蛋白质结构不断增加,几乎照亮了整个蛋白质宇宙,我们可以期待每天都有更多的生物谜团被解开.」
AlphaFold 的影响
自发布至今,AlphaFold 已产生令人难以置信的影响.它是 DeepMind 构建的最复杂的人工智能系统,需要多项关键创新,并已应用到多种下游任务中.
AlphaFold2 可以在原子精度上准确地预测蛋白质的结构,它不仅为生物学中 50 年来的重大挑战提供了解决方案,也证明了:人工智能可以极大地加速科学发现,进而推动人类进步,这一点意义重大.
DeepMind 已经开源了 AlphaFold 的代码,并在《自然》杂志上发表了两篇深度论文,引用量已超过 4000.此外,DeepMind 还与 EMBL-EBI 合作设计了一种帮助生物学家使用 AlphaFold 的工具,并共同发布了 AlphaFold DB.
在发布 AlphaFold 之前,DeepMind 征求了 30 多名生物学研究专家的意见,使得他们以最大化潜在利益和最小化潜在风险的方式与世界分享 AlphaFold .
迄今为止,来自 190 个国家 / 地区的超过 500000 名研究人员访问了 AlphaFold DB,查看了超过 200 万个结构.一些免费提供的蛋白质结构也已集成到其他公共数据集中,例如 Ensembl、UniProt 和 OpenTargets,被数百万用户访问.
在与其他机构合作时,DeepMind 优先考虑那些最具积极社会效益的应用,重点关注那些资金不足或被忽视的计划.
拼凑核孔复合体
在最新一期《科学》杂志特刊上,几个研究团队描述了 AlphaFold 帮助拼凑核孔复合体——生物学中最具挑战性的难题之一.这个巨大的结构由数百个蛋白质部分组成,控制着进出细胞核的一切.
人们通过使用现有的实验方法揭示它的轮廓,结合 AlphaFold 预测完成和解释其中不清楚的区域,最终揭示了它的微妙结构.《科学》将其称为实验结构生物学的胜利,这种新研究方式现在正成为实验室的常规做法,开启了新的科学研究道路.
结构搜索工具
Foldseek、Dali 等结构搜索工具允许用户非常快速地搜索与给定蛋白质相似的结构.这将是为实际有用的蛋白质(例如分解塑料的蛋白质)挖掘大型序列数据集的第一步,它可以提供有关蛋白质功能的线索.
对人类健康的影响
AlphaFold 已经对人类健康产生了重大而直接的影响.与欧洲人类遗传学会的合作证明 AlphaFold 对于解开罕见遗传疾病的原因至关重要.此外,AlphaFold 还通过更好地了解新发现的可能成为药物靶点的蛋白质,帮助科学家更快地找到与其结合的潜在药物来加速药物发现.
参考内容:
https://www.science.org/doi/10.1126/science.add2210
https://www.theverge.com/2022/7/28/23280743/deepmind-alphafold-protein-database-alphabet
https://www.deepmind.com/blog/alphafold-reveals-the-structure-of-the-protein-universe
https://www.nature.com/articles/d41586-022-02083-2
-------- End --------
精选内容
边栏推荐
猜你喜欢
ICML 2022 | 图神经网络的局部增强
[Niu Ke brush questions-SQL big factory interview questions] NO5. Analysis of a treasure store (e-commerce model)
九州云出席领航者线上论坛,共话5G MEC边缘计算现状、挑战和未来
【毕设选题推荐】机器人工程专业毕设选题推荐
metaRTC5.0新版本支持mbedtls(PolarSSL)
七夕邂逅爱,那人一定在
zabbix自定义图形
将 Sentinel 熔断限流规则持久化到 Nacos 配置中心
How to play the Tower of Hanoi
手搓一个“七夕限定”,用3D Engine 5分钟实现烟花绽放效果
随机推荐
Is there a replacement for the LM2596?LM2576 can
zabbix自定义图形
Lixia Action | Kyushu Yunzhang Jinnan: Open source is not a movement for a few people, popularization is the source
ACL 2022 | 社会科学理论驱动的言论建模
Convolutional Neural Network Basics
[机缘参悟-60]:《兵者,诡道也》-1-开篇:“死“与“生“都是天道
1375. 二进制字符串前缀一致的次数-前序遍历法
关于redis的几件小事(五)redis保证高并发以及高可用
leetcode 48. Rotate Image (Medium)
数据库恢复
word2003按空格键为什么会出现小数点
Oracle RAC环境下vip/public/private IP的区别
SMART S7-200PLC串行自由口通讯(耐压测试仪)
2042. 检查句子中的数字是否递增-力扣双百代码-设置前置数据
考研上岸又转行软件测试,从5k到13k完美逆袭,杭州校区小哥哥拒绝平庸终圆梦!
信创是什么意思?涉及哪些行业?为什么要发展信创?
世间几乎所有已知蛋白质结构,都被DeepMind开源了
零基础可以转行软件测试吗 ?这篇文章告诉你
Kyushu Cloud attended the Navigator Online Forum to discuss the current status, challenges and future of 5G MEC edge computing
Centos7 install mysql version rapidly