`
wanguan2000
  • 浏览: 68566 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

化学信息学网站收集 cheminformatics databases

阅读更多

Free datasets for QSAR and QSPR modelling

Open and freely available datasets are important to develop, test and validate new calculational methods. Without such datasets innovation in the past was seriously hindered because such datasets had to be collected from the printed literature or were only available in commercial databases with stringent copyright issues. For further discussions see Blue Obelisk . Some QSAR journals require submissions of raw data sets.

  • Free datasets from QSAR world [LINK ]
  • Free datasets from Cheminformatics.org [LINK ]


Download isomer structures

Free isomer structures are important for metabolomics, QSAR research and chemistry in general. Structures can be downloaded as 1D, 2D or 3D represantations. Mostly SMILES and SDF files are provided.

  • PubChem FTP [LINK] and specifications [LINK ] or PUG
  • Chemspider a fast growing open DB with numerous APIs [LINK ]
  • NCI datasets NCI99, NCI2000 as SMI, SDF [LINK ] with head collector [LINK ] from the CACTUS group (NCI/CADD)
  • Public Database collection [LCM CIS ] at CADD
  • CCCBDB - Computational Chemistry Comparison and Benchmark DataBase [LINK ]
  • PDB Ligand Expo - Small molecules as SDF, CIF, PDBML, mmCIF, SMILES from the PDB database [LINK ]


Database Collector pages

Database collectors are compilation of multiple databases sorted according to different fields and approaches.

  • UNI Jena DB collector [LINK ]
  • Thirty-Two Free Chemistry Databases [LINK ] by Rich Apodaca (depth-first)
  • Comprensive list at Indiana EDU [LINK ]


3D Structures and X-ray crystallography (small molecules)

3D structures can be used to develop and validate structural conformer software. Most of the structures are not open accessible, allthough this is changing right now. Services like Crystaleye and Reciprocal Net provide free (open) access to such structures.

  • CrystalEye - covers CIF and PDF structures from most/all journals
  • Reciprocal Net - covers a selection of CIF and PDB structures
  • MERCK and MMFF94 validation set on CCL FTP  

china:

http://www.chemgogo.com

http://www.chemgogo.cn

http://bio.chemgogo.cn

 

 

0
0
分享到:
评论

相关推荐

    基于Matlab图形用户界面化学信息学教学平台建设.pdf

    化学信息学是一门综合数学、统计学、基础化学、信息学和计算机编程等多学科知识的交叉学科。它主要研究化学体系的波谱模拟、分子模拟等计算机模拟,以及通过回归分析和主成分分析等方法进行化学信息的处理与分析。其...

    bio信息学-chem信息学

    在IT领域,Bio信息学和Chem信息学是两个交叉学科,它们分别专注于生物学和化学数据的分析、解读和应用。这两个领域在近年来由于高通量数据的爆炸性增长,已经成为了科研和技术发展的重要推动力。 Bio信息学是利用...

    生物信息学的现状与未来

    生物信息学数据库收集和整理了大量生物分子的序列、结构和功能信息,为研究人员提供了一个高效获取和利用数据的平台。文章中提及的GenBank、EMBL、DDBJ和SWISS-PROT等公共数据库资源,都是生物信息学领域著名的...

    生物信息学在工业生物催化研究中的应用

    同时,跨学科合作将成为推动该领域发展的重要力量,促进生物信息学与生物化学、化学工程等领域的深度融合,共同解决工业生物催化面临的挑战。 综上所述,生物信息学为工业生物催化技术的发展提供了强大的支持,不仅...

    生物信息学、生物信息学概论、生物信息学算法导论

    《生物信息学》、《生物信息学概论》和《生物信息学算法导论》这三本书涵盖了生物信息学的基础理论、核心概念以及关键算法,是深入理解这一领域的重要参考资料。生物信息学是一门交叉学科,它综合了生物学、计算机...

    信奥学习规划 信息学竞赛之路(2022.07.31).pdf

    信奥学习规划信息学竞赛之路 信奥学习规划是指全国青少年信息学奥林匹克竞赛(National Olympiad in Informatics, NOI)和中国少年信息学竞赛(CSP-J/S)的学习规划和指导。以下是根据提供的文件信息,总结的相关...

    RDKit:开源化学信息学和机器学习-开源

    用C ++和Python编写的化学信息学和机器学习软件的集合。 注意:RDKit源代码和下载现在在github中:https://github.com/rdkit/rdkit核心算法和数据结构是用C ++编写的。 提供了包装程序以使用来自Python或Java的工具...

    生物信息学中的计算机技术

    6. **学科前沿与学习路径**:鉴于生物信息学的前沿性质,掌握分子生物学、化学、数学基础,以及一定的计算机编程技能,对深入理解该领域至关重要。本书结构清晰,分四个部分逐步引导读者进入生物信息学的世界。 ###...

    化学计量学方法及MATLAB实现

    化学计量学方法及MATLAB实现~

    信息学奥赛一本通(提高篇)测试数据.rar

    《信息学奥赛一本通(提高篇)测试数据》是一个针对信息学竞赛的资源包,主要包含了一系列用于训练和检验编程能力的测试题目和样例数据。信息学奥赛,全称为国际信息学奥林匹克竞赛(IOI),是全球青少年科技竞赛之一...

    生物信息学算法

    生物信息学算法是生物学研究中一种非常重要的工具,它涉及到大量生物数据的分析、处理与解释。生物信息学在基因组学、蛋白质组学、系统生物学等多个研究领域中发挥着越来越重要的作用。2015年第十五届国际生物信息学...

    最新版信息学奥赛课课通配套资料C++.zip

    《最新版信息学奥赛课课通配套资料C++.zip》是针对信息学奥林匹克竞赛的一套全面学习资源,专门针对C++编程语言进行设计。这个压缩包包含了丰富的学习材料,旨在帮助参赛者深入理解和掌握信息学竞赛所需的核心技能。...

    信息学奥赛课课通(C++)配套资料(包括电子课件PPT、习题答案、习题参考代码、测试数据)

    《信息学奥赛课课通(C++)》是一套为信息学竞赛爱好者精心准备的教育资源,涵盖了C++编程语言的基础知识以及在信息学竞赛中的高级应用。这套配套资料是全面学习和准备信息学竞赛的重要参考资料,包含了丰富的学习...

    信息学金牌教练曹老师上课视频

    常州高级中学金牌信息学教练曹老师的上课视频 很是难得的好资料

    生物信息学札记_第三版_浙大版_2010年.pdf

    生物信息学是应用信息科学的原理和技术,处理和分析生物学数据的科学。这门学科兴起于20世纪末,随着分子生物学和计算机技术的发展而迅速发展。生物信息学的应用包括但不限于基因组学、蛋白质组学、药物设计和系统...

    信息学奥林匹克竞赛基础知识.ppt

    信息学奥赛NOI和NOIP的基础知识,PPT版本,准备参加信息学奥赛的同学可以下载看看哦!

    MonteCarlo化学动力学程序的MATLAB实现及其应用

    ### Monte Carlo化学动力学程序的MATLAB实现及其应用 #### 关键知识点概览: 1. **Monte Carlo方法概述**:介绍了Monte Carlo方法的基本原理,强调其在处理随机性和不确定性问题上的优势。 2. **MATLAB在化学动力...

    生物信息学

    ### 生物信息学中的常见误解及其影响 #### 一、生物信息学的定义与重要性 生物信息学作为一门新兴交叉学科,集成了生物学、计算机科学以及统计学等多个领域的知识和技术,旨在解决生命科学中的复杂问题。随着基因...

    2014江苏省小学生信息学竞赛题目和答案

    2014年 江苏省 小学生组 信息学竞赛 题目 和 参考答案.

    信息学奥赛基础知识习题(答案版)

    这些题目涵盖了计算机基础和信息技术的多个方面,适合于信息学奥赛初赛的准备。以下是对各个题目涉及知识点的详细解释: 1. 计算机系统由硬件系统和软件系统组成,选择题第一题的正确答案是 (C) 计算机系统。这包括...

Global site tag (gtag.js) - Google Analytics