Free datasets for QSAR and QSPR modelling
Open
and freely available datasets are important to develop, test and
validate new calculational methods. Without such datasets innovation in
the past was seriously hindered because such datasets had to be
collected from the printed literature or were only available in
commercial databases with stringent copyright issues. For further
discussions see Blue Obelisk
. Some QSAR journals require submissions of raw data sets.
- Free datasets from QSAR world [LINK
]
- Free datasets from Cheminformatics.org [LINK
]
Download isomer structures
Free
isomer structures are important for metabolomics, QSAR research and
chemistry in general. Structures can be downloaded as 1D, 2D or 3D
represantations. Mostly SMILES and SDF files are provided.
- PubChem FTP [LINK] and specifications [LINK
] or PUG
- Chemspider a fast growing open DB with numerous APIs [LINK
]
- NCI datasets NCI99, NCI2000 as SMI, SDF [LINK
] with head collector [LINK
] from the CACTUS group (NCI/CADD)
- Public Database collection [LCM CIS
] at CADD
- CCCBDB - Computational Chemistry Comparison and Benchmark DataBase [LINK
]
- PDB Ligand Expo - Small molecules as SDF, CIF, PDBML, mmCIF, SMILES from the PDB database [LINK
]
Database Collector pages
Database collectors are compilation of multiple databases sorted according to different fields and approaches.
- UNI Jena DB collector [LINK
]
- Thirty-Two Free Chemistry Databases [LINK
] by Rich Apodaca (depth-first)
- Comprensive list at Indiana EDU [LINK
]
3D Structures and X-ray crystallography (small molecules)
3D
structures can be used to develop and validate structural conformer
software. Most of the structures are not open accessible, allthough
this is changing right now. Services like Crystaleye and Reciprocal Net
provide free (open) access to such structures.
-
CrystalEye
- covers CIF and PDF structures from most/all journals
-
Reciprocal Net
- covers a selection of CIF and PDB structures
- MERCK and MMFF94 validation set on CCL FTP
china:
http://www.chemgogo.com
http://www.chemgogo.cn
http://bio.chemgogo.cn
分享到:
相关推荐
《化学信息学》是化学领域的一个重要分支,它结合了化学、计算机科学和信息技术,旨在高效管理和分析化学信息。化学信息学的主要目标是从海量的化学数据中挖掘有价值的知识,促进新化合物的发现和化学研究的进步。 ...
化学信息学,也被称为计算机化学,是一门新兴的交叉学科,随着计算机技术与信息技术的快速发展而兴起,主要关注如何利用这些技术解决化学问题,特别是在分子结构分析、化学数据处理及信息检索方面。化学信息学的发展...
深度学习在化学信息学中的应用已经成为了人工智能在科学研究领域的一大亮点。化学信息学是一门结合化学、计算和统计方法的交叉学科,旨在理解和预测化学物质的性质及其与生物系统的相互作用。随着深度学习技术的发展...
**RDKit化学信息学包**,是一个在Ubuntu操作系统下广泛使用的开源工具,它为Python和C++编程语言提供了丰富的功能,旨在处理、分析和理解化学数据。RDKit,全称Reaction Database Kit,由Lawrence Berkeley National...
生物信息学是一门结合生物学、计算机科学、统计学和数学的交叉学科,旨在处理和解析生物数据,尤其在基因组学、蛋白质组学以及系统生物学等领域。本套课程讲义全面覆盖了生物信息学的基础理论与实践应用,适用于本科...
用C ++和Python编写的化学信息学和机器学习软件的集合。 注意:RDKit源代码和下载现在在github中:https://github.com/rdkit/rdkit核心算法和数据结构是用C ++编写的。 提供了包装程序以使用来自Python或Java的工具...
算法艺术与信息学竞赛.pdf算法艺术与信息学竞赛.pdf算法艺术与信息学竞赛.pdf算法艺术与信息学竞赛.pdf算法艺术与信息学竞赛.pdf算法艺术与信息学竞赛.pdf算法艺术与信息学竞赛.pdf算法艺术与信息学竞赛.pdf算法艺术...
通过网站链接提供的资源,读者可以找到相关的教学视频和在线练习题,如信息学奥赛一本通-编程启蒙 3001和1001题,以及01:Hello, World!问题,这些都是为了帮助读者理解并实践输出功能。 第二章深入讲解了C++的输入...
信息学奥赛一本通,编程启蒙
《信息学奥赛一本通初赛篇》是针对信息学竞赛初学者的入门教材,主要涉及C++编程语言和算法问题解决。以下是该书部分内容的知识点解析: 1. 图论应用: - 题目描述了学生阅读书籍的情况,可以看作是一个集合覆盖...
这本书详细介绍了R与bioconducor在生物信息学的应用。不仅详细介绍了一些生物信息学的内容,还介绍了相关算法流程,程序编程等
化学计量学方法及MATLAB实现~
信息学奥赛之数学一本通,林厚之,PDF
《R语言与BIOCONDUCTOR生物信息学应用》是一本深入探讨如何使用R语言及其BIOCONDUCTOR套件进行生物信息分析的专著。R语言是生物信息学领域广泛应用的一种统计计算和图形制作工具,而BIOCONDUCTOR项目则为R语言提供了...
实验内容包括浏览多个国内外生物信息学网站,下载代表性数据,并讨论这些网站在生物信息学研究中的应用。 实验二则专注于BLAST(Basic Local Alignment Search Tool)的使用,这是生物信息学中常用的序列比对工具。...
信息学奥赛NOI和NOIP的基础知识,PPT版本,准备参加信息学奥赛的同学可以下载看看哦!
CSP-J/S, NOIP, 信息学奥林匹克竞赛真题收录CSP-J/S, NOIP, 信息学奥林匹克竞赛真题收录CSP-J/S, NOIP, 信息学奥林匹克竞赛真题收录CSP-J/S, NOIP, 信息学奥林匹克竞赛真题收录CSP-J/S, NOIP, 信息学奥林匹克竞赛...
第一章:计算机基础知识 第二章:C++编程简介 第三章:C++输入|输出流 第四章:文件处理 第五章:C++字符串流 第六章:控制结构 第七章:函数 第八章:数组 第九章:指针与字符串 第十章:信息学奥赛常用算法
【标题】"2020年浙江省信息学省选题目及数据(ZJOI2020)"涉及的是信息学竞赛的重要组成部分,主要聚焦在编程解决问题的能力和算法设计上。这一比赛通常针对中学生,旨在提升他们的计算思维和信息技术素养。 【描述...
信息学奥赛,全称奥林匹克信息学竞赛(Olympiad in Informatics,简称OI),是一项全球范围内的青少年科技赛事,旨在提升青少年的计算机编程、算法设计、数据结构和问题解决能力。这些压缩包文件包含了从2017年至...