当前位置:网站首页>CADD课程学习(6)-- 获得已有的虚拟化合物库(Drugbank、ZINC)

CADD课程学习(6)-- 获得已有的虚拟化合物库(Drugbank、ZINC)

2022-07-05 07:18:00 发呆的比目鱼

CADD课程学习(6)-- 获得已有的虚拟化合物库(Drugbank、ZINC)

Drugbank数据库简介

DrugBank数据库DrugBank是阿尔伯塔大学提供的一个生物信息学和化学信息学数据库,是一种独特的生物信息学和化学信息学资源,它将详细的药物数据和全面的药物目标信息结合起来。

最近发布的DrugBank版本5.1.9,2022-01-03版)包含13577种药物条目,其中包括2634种经批准的小分子药物、1377种经批准的生物技术(蛋白质/肽)药物、131种营养品和6375种实验药物。此外,5241个非元余蛋白(即药物靶标/酶/转运体/载体)序列与这些药物条目相关联,每个DruaCard条目包含200多个数据字段,其中一半用于药物/化学数据,另一半用于药物靶标或蛋白质数据。

DuoBank最大的特色是它支持全面而复杂的搜索,结合DrugBank可课化软件,这些工具能让科学家们非常含易的检素到新的药物配目标比较药物结构、研究药物机制以及探索新型药物。

ZINC数据库简介

ZINC数据库用于虚拟筛选的市售化合物的免费数据库。ZINC包含超过1300万种3D格式的可购买化合物。ZINC由位于加利福尼亚大学旧金山分校(UCSF)药物化学系的Shoichet实验室提供。

ZINC数据库是一个小分子结构数据库,在该数据库中存放有大量现在市场销售的小分子化合物这就为药物研发提供了非常方便的药物性质测试,而不用去自行设计合成路线获得小分子化合物之后再进行相关药物活性的测试。特别是针对如今计算技术的发展越来越多的计算机辅助药物设计方案的出现加快的了药物筛选的进程。在通过ZINC数据库大量分子的筛选之后可以直接将筛选出的可能有活性的化合物通过ZINC提供的连接找到供应商购买小分子化合物,从而方便快捷的测定药物体外活性。

ZINC免费数据库收录了ChemBridge、Enamine和PubChem等众多化合物数据,可全部免费下载并可下载单个供应商的数据。

ZINC数据库包含包括片段库、类药性库、药物库、天然产物库等,这些化合物含有供应商、分不量可旋转键数氢键受体及供体等信息、可根据客户需要,下载指定数据库讲行虚拟筛选。

ZINC20

ZINC的规模不断扩大,ZINC20现在包括14亿化合物,其中13亿来自150个公司共310个产品目录。这些化合物满足90/90/90规则,即超过90%的目录每90天更新一次且90%以上的化合物均可购买。新增的数据集包括1010个分子,暂未添加到ZlNC中。
为了研究按需定制库与物理筛选平台中分子的多样性,作者从骨架多样性和分子形状两方面开展实验。对ZINC按需定制库(大部分来自Enamine REAL)和其他几个公开的物理筛选库(NIH的小分子库MLSMR,UCSF小分子库SMDC,ZIN的Ro4化合物存货)计算Bemis-Murcko骨架并统计每个骨架内化合物的数量。

研究结果显示,按需定制库中超过97%的化合物无法在ZINC存货中找到,新的骨架数量几乎与分子数量呈线性关系增长。当骨架数量增长16倍时,按需定制库的分子数量是ZINC存货库的88倍。使用NPMI方法对各库分子形状分类后发现,按需定制库的分子在结构上也比物理筛选库更多样化,盘状(如苯环)及球形(如金刚烷)分子大幅增加。

搜索

下载

选中要下载范围
下载方法:
1.在ZINC中选择某个分子量和logP性质范围的数据,下载smi,获得ZINC-downloader-2D-4mi.wget文件工
2.下载wgetwin-1531-binary并解压,点击里面的wget.exe文件93.设置wgetwin-1531-binary为系统环境变量中PATH变量的一员(目录尽量不要包含中文);
4.把ZINC-downloader-2D smi.wget文件和wget.exe文件放到同一目录;
5.打开cmd窗口,wget.exe -i ZINC-downloader-2D-smi.wget

ChEMBL数据库简介

ChEMBL数据库是欧洲生物信息研究所(European Bioinformatics Institute,EB1)开发的一个在线的免费数据库,它通过从大量文献中收集各种靶点及化合物的生物活性数据,为药物化学家们提供了一个非常便利的查询靶点或化合物的生物活性数据的平台。截至2019年10月29日,该数据库共收集了12482个靶点,187.9万个化合物,共有15500万条生物活性信息

通过该数据库,用户可以快速查询到某个靶点目前以报道的化合物及其活性信息,也可以查询某个化合物在哪些靶点做个生物活性测试及其数据。这些数据都来源于各种已报道的文献,数据较为可靠,且能够溯源,查询到数据的出处。通过该数据库,用户可以节省大量查阅文献和收集化合物数据的时间,快速获取准确的化合物及其生物学数据,进一步加速药物设计和药物开发的速度。

天然产物与中药成分数据库

海洋天然产物数据库:http://mc3d.qnlm.ac/
TCMSP中药系统药理学数据库与分析平台:https//old tcmsp-e.com/tcmsp.php
天然产物数据库:http:/harmdata.ncmicn/virtualcompound/index.asp

原网站

版权声明
本文为[发呆的比目鱼]所创,转载请带上原文链接,感谢
https://blog.csdn.net/weixin_42486623/article/details/125476366