Free datasets for QSAR and QSPR modelling
Open
and freely available datasets are important to develop, test and
validate new calculational methods. Without such datasets innovation in
the past was seriously hindered because such datasets had to be
collected from the printed literature or were only available in
commercial databases with stringent copyright issues. For further
discussions see Blue Obelisk
. Some QSAR journals require submissions of raw data sets.
- Free datasets from QSAR world [LINK
]
- Free datasets from Cheminformatics.org [LINK
]
Download isomer structures
Free
isomer structures are important for metabolomics, QSAR research and
chemistry in general. Structures can be downloaded as 1D, 2D or 3D
represantations. Mostly SMILES and SDF files are provided.
- PubChem FTP [LINK] and specifications [LINK
] or PUG
- Chemspider a fast growing open DB with numerous APIs [LINK
]
- NCI datasets NCI99, NCI2000 as SMI, SDF [LINK
] with head collector [LINK
] from the CACTUS group (NCI/CADD)
- Public Database collection [LCM CIS
] at CADD
- CCCBDB - Computational Chemistry Comparison and Benchmark DataBase [LINK
]
- PDB Ligand Expo - Small molecules as SDF, CIF, PDBML, mmCIF, SMILES from the PDB database [LINK
]
Database Collector pages
Database collectors are compilation of multiple databases sorted according to different fields and approaches.
- UNI Jena DB collector [LINK
]
- Thirty-Two Free Chemistry Databases [LINK
] by Rich Apodaca (depth-first)
- Comprensive list at Indiana EDU [LINK
]
3D Structures and X-ray crystallography (small molecules)
3D
structures can be used to develop and validate structural conformer
software. Most of the structures are not open accessible, allthough
this is changing right now. Services like Crystaleye and Reciprocal Net
provide free (open) access to such structures.
-
CrystalEye
- covers CIF and PDF structures from most/all journals
-
Reciprocal Net
- covers a selection of CIF and PDB structures
- MERCK and MMFF94 validation set on CCL FTP
china:
http://www.chemgogo.com
http://www.chemgogo.cn
http://bio.chemgogo.cn
分享到:
相关推荐
化学信息学,也被称为计算机化学,是一门新兴的交叉学科,随着计算机技术与信息技术的快速发展而兴起,主要关注如何利用这些技术解决化学问题,特别是在分子结构分析、化学数据处理及信息检索方面。化学信息学的发展...
深度学习在化学信息学中的应用已经成为了人工智能在科学研究领域的一大亮点。化学信息学是一门结合化学、计算和统计方法的交叉学科,旨在理解和预测化学物质的性质及其与生物系统的相互作用。随着深度学习技术的发展...
生物信息学概述、数据库生物信息学、生物信息学课程范围、生物信息学实例、生物信息学网站、数据采集、DNA测序原理、DNA序列类型、基因组测序策略、序列质量控制、单遍测序等。 生物信息学概述:生物信息学是生物学...
生物信息学是一门结合生物学、计算机科学、统计学和数学的交叉学科,旨在处理和解析生物数据,尤其在基因组学、蛋白质组学以及系统生物学等领域。本套课程讲义全面覆盖了生物信息学的基础理论与实践应用,适用于本科...
《信息学奥赛一本通》是一本专门为信息学竞赛爱好者准备的教材,涵盖了广泛的编程和算法知识,尤其侧重于C++编程语言的应用。这个压缩包包含的资源是这本书的题目数据,非常适合用来自我测试和提升编程技能。这些...
用C ++和Python编写的化学信息学和机器学习软件的集合。 注意:RDKit源代码和下载现在在github中:https://github.com/rdkit/rdkit核心算法和数据结构是用C ++编写的。 提供了包装程序以使用来自Python或Java的工具...
算法艺术与信息学竞赛.pdf算法艺术与信息学竞赛.pdf算法艺术与信息学竞赛.pdf算法艺术与信息学竞赛.pdf算法艺术与信息学竞赛.pdf算法艺术与信息学竞赛.pdf算法艺术与信息学竞赛.pdf算法艺术与信息学竞赛.pdf算法艺术...
通过网站链接提供的资源,读者可以找到相关的教学视频和在线练习题,如信息学奥赛一本通-编程启蒙 3001和1001题,以及01:Hello, World!问题,这些都是为了帮助读者理解并实践输出功能。 第二章深入讲解了C++的输入...
信息学奥赛一本通,编程启蒙
《信息学奥赛一本通初赛篇》是针对信息学竞赛初学者的入门教材,主要涉及C++编程语言和算法问题解决。以下是该书部分内容的知识点解析: 1. 图论应用: - 题目描述了学生阅读书籍的情况,可以看作是一个集合覆盖...
化学计量学方法及MATLAB实现~
信息学奥赛之数学一本通,林厚之,PDF
《R语言与BIOCONDUCTOR生物信息学应用》是一本深入探讨如何使用R语言及其BIOCONDUCTOR套件进行生物信息分析的专著。R语言是生物信息学领域广泛应用的一种统计计算和图形制作工具,而BIOCONDUCTOR项目则为R语言提供了...
实验内容包括浏览多个国内外生物信息学网站,下载代表性数据,并讨论这些网站在生物信息学研究中的应用。 实验二则专注于BLAST(Basic Local Alignment Search Tool)的使用,这是生物信息学中常用的序列比对工具。...
CSP-J/S, NOIP, 信息学奥林匹克竞赛真题收录CSP-J/S, NOIP, 信息学奥林匹克竞赛真题收录CSP-J/S, NOIP, 信息学奥林匹克竞赛真题收录CSP-J/S, NOIP, 信息学奥林匹克竞赛真题收录CSP-J/S, NOIP, 信息学奥林匹克竞赛...
第一章:计算机基础知识 第二章:C++编程简介 第三章:C++输入|输出流 第四章:文件处理 第五章:C++字符串流 第六章:控制结构 第七章:函数 第八章:数组 第九章:指针与字符串 第十章:信息学奥赛常用算法
《生物信息学讲义:结构信息部分》是龚海鹏教授关于生物信息学的一个专题讲解,主要涵盖了在分子生物学和生物化学中结构信息的重要性和应用。在这个领域,结构信息指的是生物大分子,如蛋白质和核酸的三维结构信息,...
标题中的“信息学奥赛 数学 物理等资料集-2021.10.01.rar”表明这是一个包含信息学奥林匹克竞赛、数学和物理相关资源的压缩包文件,日期为2021年10月1日。这个压缩包可能是为了帮助学生准备这些学科的比赛或提升学术...
信息学奥赛培训教程C++版 本教程旨在培养青少年信息学奥林匹克竞赛选手,提高他们在计算机科学和编程语言方面的知识和技能。通过本教程的学习,学生将获得计算机基础知识、C++编程语言的基础知识,并为信息学...
全国青少年信息学竞赛是针对青少年开展的一项重要科技活动,旨在培养他们的计算机编程能力、逻辑思维能力和问题解决能力。此类竞赛通常包含预赛和复赛两个阶段,其中复赛的难度和挑战性更高,对参赛者的知识掌握和...