`

开源软件/代码链接合集

阅读更多
定向抓取/抽取:http://www.scrapy.org
流式处理工具:
收集计算https://github.com/nathanmarz/storm
流数据统计https://sites.google.com/site/countminsketch/

中文处理:
简繁转换cconv: http://code.google.com/p/cconv/
汉字转拼音pinyin4j:http://pinyin4j.sourceforge.net/

字符串匹配:
ahocorasick python实现
ahocorasick: https://hkn.eecs.berkeley.edu/~dyoo/python/ahocorasick/
acora: http://pypi.python.org/pypi/acora/1.5
esmre: http://code.google.com/p/esmre/
double array trie:
libdatrie: http://linux.thai.net/~thep/datrie/datrie.html
darts:  http://chasen.org/~taku/software/darts/
darts-clone:  http://code.google.com/p/darts-clone
java aho-corasick: https://github.com/robert-bor/aho-corasick
机器学习:
分类和rank机器学习工具包sofia-ml:http://code.google.com/p/sofia-ml/
一些机器学习算法SGD实现:http://leon.bottou.org/projects/sgd
liblinear: http://www.csie.ntu.edu.tw/~cjlin/liblinear/
libsvm: http://www.csie.ntu.edu.tw/~cjlin/libsvm/
lingpipe: http://alias-i.com/lingpipe/
mahout: http://mahout.apache.org/
libfm: http://www.libfm.org/
graphChi https://code.google.com/p/graphchi/
CRF++ http://code.google.com/p/crfpp/
CRFSuitehttp://www.chokkan.org/software/crfsuite/
Wapiti http://wapiti.limsi.fr/
mloss: https://mloss.org/software/view/332

自然语言处理:
opennlp: http://opennlp.apache.org/
stanford corenlp: http://nlp.stanford.edu/software/corenlp.shtml#Download
srilm(语言模型):http://www.speech.sri.com/projects/srilm/download.html
mallet: http://mallet.cs.umass.edu/
gensim(topic model for human): http://radimrehurek.com/gensim/
TweetNLP: http://www.ark.cs.cmu.edu/TweetNLP/
java机器学习datumboxhttps://github.com/datumbox/datumbox-framework
语料:
20Newsgroups http://people.csail.mit.edu/jrennie/20Newsgroups/
南京大学机器学习与数据挖掘数据和代码http://lamda.nju.edu.cn/CH.Data.ashx
图片处理:
http://code.google.com/p/thumbnailator/
http://yann.lecun.com/exdb/mnist

latex:
latex blog edit: http://latex.codecogs.com/gif.latex?
latax学习:http://latex.yo2.cn
latax Symbols: http://www.artofproblemsolving.com/Wiki/index.php/LaTeX:Symbols
http://web.ift.uib.no/Teori/KURS/WRK/TeX/symALL.html
latax mathhttp://en.wikibooks.org/wiki/LaTeX/Mathematics
http://www.artofproblemsolving.com/Wiki/index.php/Math

cache:
simple-spring-memcached: http://code.google.com/p/simple-spring-memcached/wiki/Getting_Started
收藏链接:
ML/NLP: http://lxmls.it.pt/2013/
python数据分析http://datacommunitydc.org/blog/2013/07/python-for-data-analysis-the-landscape-of-tutorials/?utm_source=rss&utm_medium=rss&utm_campaign=python-for-data-analysis-the-landscape-of-tutorials
Science Machine learning resource: http://m.sciencemag.org/site/feature/data/compsci/machine_learning.xhtml

公开课和slides:
语言类:http://www.codecademy.com/
数据科学https://github.com/bcaffo/courses
CMU高级机器学习http://www.cs.cmu.edu/~./epxing/Class/10715/lecture.html
凸优化http://so.v.ifeng.com/video?q=%E5%87%B8%E4%BC%98%E5%8C%96&c=5#_v_mininav_search_pc
smola的课程http://alex.smola.org/teaching/
分享到:
评论

相关推荐

    开源阅读软件书源-内涵上千书源

    开源阅读软件书源-内涵上千书源

    机器视觉开源代码链接集合

    - ITK(Insight Segmentation and Registration Toolkit):是一个专门用于图像分割和配准的开源软件系统。它支持多种图像处理算法,尤其是三维医学图像处理。 3. 目标检测(Object Detection):目标检测是指在...

    Qt 开源代码 艾宾浩斯(Ebbinghaus)记忆 软件

    开源软件的一大优势在于社区支持和持续改进。用户和开发者可以查看和修改源代码,提出建议或修复问题,共同推动软件的发展。你可以在链接(http://blog.csdn.net/qq_35488967/article/details/78506603)中找到更多...

    软件定时器源代码完全开源

    本开源项目提供了一套完整的软件定时器源代码,包括`.c`和`.h`文件,适用于各种单片机平台,尤其已经在STM32上进行了验证并确认可用。 首先,我们来详细了解一下软件定时器的基本概念。软件定时器,顾名思义,是由...

    Conversations,conversations是android平台的开源xmpp/jabber客户端.zip

    11. **隐私保护**:除了端到端加密,Conversations还注重防止追踪和恶意软件,比如通过阻止跟踪像素和不安全链接来保护用户的安全。 12. **设备同步**:用户可以在不同的Android设备之间同步聊天记录和设置,保持...

    OA开源代码

    总的来说,PHPOA开源代码的发布,为中国的OA市场带来了创新和开放的解决方案,降低了企业的IT成本,同时推动了开源软件的发展。对于开发者而言,这是一个极好的学习和定制的平台,可以依据自身需求进行二次开发。...

    开源软件法律风险分析与防范1

    开源软件,源自20世纪70年代的黑客文化,是一种遵循特定许可证、提供源代码、拥有版权且允许自由使用、修改和分发的软件。1998年,OSIA(开放源代码倡议组织)的成立,旨在推广开源软件在商业中的应用,其认证的许可...

    金山卫士开源代码

    【金山卫士开源代码】是安全领域的一款知名软件,其开源版本为开发者提供了一次深入研究和学习安全软件实现机制的宝贵机会。金山卫士主要致力于保护用户的计算机免受病毒、木马、恶意软件等威胁,它包含了丰富的防...

    H.264 开源代码

    提到“许可”,意味着该开源代码遵循某种开源软件许可证,如GPL、LGPL、MIT等,这些许可证规定了代码的使用、分发和修改规则,保障了开源社区的协作和创新。 5. **实际应用** H.264编码广泛应用于网络视频流媒体...

    开源的BACNET 源代码

    这种开放源代码的实现有助于减少开发成本,提高软件的可移植性和可靠性,同时也为那些希望深入理解BACNET工作原理的工程师提供了宝贵的参考。 在"bacnet-stack-0.5.8"这个压缩包中,我们可以找到一个实现BACNET协议...

    android开源桌面代码

    2. **MODULE_LICENSE_APACHE2 和 NOTICE 文件**:这两个文件通常与开源软件的许可协议相关。MODULE_LICENSE_APACHE2表示该代码遵循Apache 2.0许可证,这是一种允许商业使用的宽松开源许可证。NOTICE文件则可能包含对...

    开源飞信 开源代码openfetion

    openfetion是基于GTK+2.0的飞信开源IM客户端,使用中国移动飞信v4版本协议。 同类软件还有一个叫LibFetion,但是有半年多无...* 完全开源,没有链接非开源库。 * 使用 v4 协议,实现了直接发送短信、自定义头像等功能

    张雄链接的开源代码

    【标题】"张雄链接的开源代码"涉及的是与有限元方法相关的计算机程序,这些代码主要来源于清华大学张雄教授的官方网站。有限元方法(Finite Element Method, FEM)是一种广泛应用的数值计算方法,用于求解各种工程和...

    我的一些开源软件 我的一些开源软件我的一些开源软件

    开源软件是指源代码可以被公众查看、使用、修改和分发的软件。这些软件通常遵循特定的开源许可证,如GPL、MIT或Apache License等,鼓励协作和社区驱动的开发。 在描述中,虽然内容重复,但我们可以推断出这是作者...

    中国开源软件法治建设状况分析.pptx

    开源软件是指软件的编写者将其源代码(通常是免费地)提供给使用者的一种软件形式。开源的核心不仅在于源代码的开放,还包含了对源代码进行修改和传播的一系列规范。 #### 二、开源软件的规范与要求 根据全球范围...

    开源图标集合,分享给大家

    ### 开源图标集合知识点解析 #### 一、开源图标集概览 ...通过上述内容,我们不仅了解到了一个具体的开源图标集项目,还深入探讨了自由软件的核心理念。这对于促进开放共享的文化、推动技术创新具有重要意义。

    IEC61850开源代码libIEC61850

    2. 开源特性:作为开源软件,libIEC61850允许开发者根据自己的需求对其进行定制和扩展,有利于促进变电站自动化领域的创新和合作。 3. 平台兼容:libIEC61850库支持多种操作系统,如Linux、Windows等,具备广泛的...

    PZStudio开源大师兄

    PZStudio是一款专为开发者设计的开源编程软件,它提供了丰富的功能,旨在提高程序员的工作效率和代码质量。该软件支持多种编程语言,包括但不限于C/C++、Python、Java等,使得跨平台开发变得更加便捷。PZStudio的...

    搭建java开源软件wiki

    描述中提供的链接指向了一个ITEYE博客文章,虽然具体内容没有给出,但我们可以推测博主分享了搭建Java开源软件Wiki的详细步骤。在实际操作中,搭建Wiki可能包括以下几个关键步骤: 1. **选择合适的开源软件**:许多...

    DotSpatial开源软件下载

    DotSpatial是一个专门为地理信息系统(GIS)领域设计的开源软件,它的特点和应用范围相当广泛,同时它的源代码完全开放,这意味着用户可以自由地下载、查看以及修改软件的源代码。对于GIS开发者来说,这不仅提供了一...

Global site tag (gtag.js) - Google Analytics