`
GT07
  • 浏览: 2752 次
  • 性别: Icon_minigender_1
  • 来自: 上海
最近访客 更多访客>>
社区版块
存档分类
最新评论

开源索引系统

阅读更多
1,Lucene
http://lucene.apache.org/

2,Sphinx
Sphinx是一个高效的索引系统,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索。Sphinx特别为一些脚本语言设计搜索API接口,如PHP,Python,Perl,Ruby等,同时为MySQL也设计了一个存储引擎插件。速度比
http://www.sphinxsearch.com/

3,Hyper Estraier
http://hyperestraier.sourceforge.net/

4,DataparkSearch Engine
http://www.dataparksearch.org/

5,FirteX
    中科院开发的一个功能强大、高性能、灵活的全文索引和检索平台。 FirteX 的主要目标是研究文本索引的快速构建 (Index Construction) ,动态文档集的索引维护 (Index Maintenance) ,短语查询 (Phrase Query),Top-k 查询的快速处理 (Top-k Query Process) 以及各种检索模型( IR Model )等。高性能和灵活的架构也使 FirteX 可以应用在产品搜索,桌面搜索,站内搜索,新闻搜索, Blog 搜索,学术搜索以及大规模搜索引擎等领域中。主要特点是基本类结构模仿了LUCENE,在合并索引等方面有所创新,实现了所谓DBT的动态平衡树来进行索引合并管理,很是提高了性能。
http://www.firtex.org/

6,Xapian
C++开发的概率信息检索库,强大的功能,实现范例为 Omega
现支持:Perl, Python, PHP, Java, TCL语言
主页: http://www.xapian.org/

7,MG-1.2.1
Ref: Managing Gigabytes: Compressing and Indexing Documents and Images
http://www.cs.mu.oz.au/mg/

8,Egothor
java信息检索库,捷克人Leo Galambos为开发主理,应用在Capek
http://www.egothor.org/




分享到:
评论

相关推荐

    开源项目-pilosa-pilosa.zip

    Pilosa 是一个高度可扩展的开源索引系统,它使用了 Go 语言进行开发,专为快速数据处理和分析而设计。这个压缩包“pilosa-pilosa.zip”包含的是 Pilosa 项目的源代码,版本可能是“pilosa-master”,意味着它是主...

    thinkphp 5.0开源商城系统,开源多用户系统.zip

    此外,系统还可能采用了MySQL作为数据库,通过优化的SQL查询和索引设计,提高了数据访问效率。同时,系统的安全性也是不容忽视的一环,包括防止SQL注入、XSS攻击等安全措施,保障了用户数据的安全。 在文件列表中,...

    开源oa系统

    开源OA系统是一款基于开源技术构建的企业办公自动化解决方案,旨在提高企业内部的工作效率和协同能力。其核心特性包括但不限于文档管理、工作流程自动化、任务分配、会议安排、公告通知以及电子邮件集成等。这款系统...

    asp.net开源博客系统

    1. **性能优化**:通过缓存策略、数据库索引、异步处理等方式提高系统性能。 2. **安全性**:考虑XSS、CSRF等安全问题,使用HTTPS加密传输,加强身份验证和授权机制。 3. **国际化与本地化**:支持多语言,为不同...

    nachos二级索引文件系统结题报告及源代码

    Nachos是一个开源的操作系统教学平台,它为学生提供了理解和实现操作系统基本概念的机会。在这个实验中,我们面对的任务是扩展Nachos的文件系统,引入二级索引来提高文件查找的效率。 在传统的文件系统中,如FAT或...

    开源社区系统设计与开发

    在系统设计时,需要合理设计数据库表结构,确保数据的一致性和完整性,同时考虑性能优化,如索引的创建和查询的优化。 开源社区系统的设计通常包含以下几个主要模块: 1. 用户模块:包括用户注册、登录、个人信息...

    网络蜘蛛webspider开源系统

    总的来说,【网络蜘蛛Webspider开源系统】是一个功能全面、技术先进的网络爬虫框架,它结合了高效的消息队列、分布式存储、强大的去重策略以及灵活的索引方案,为开发者提供了强大而易用的网页抓取工具。对于希望...

    ## JEECMS 国内最知名的Java开源CMS系统

    作为国内最知名的Java开源CMS系统,我们一直秉承开源、易用、高性能、安全的系统开发原则,并以作国内优秀的开源网站管理系统为己任,始终坚持不懈地为用户提供强大的Java技术web应用服务。 JEECMS v2.4.2 正式版...

    开源搜索系统 Red-Piranha

    Red-Piranha是一款开源的搜索系统,专为高效、可扩展和高度自定义的全文检索与数据挖掘设计。它提供了一整套强大的工具和技术,帮助用户处理大量数据并快速找到所需信息。开源软件的优点在于其透明性、社区支持和...

    Easycart外贸开源系统

    Easycart外贸开源系统是一款专为外贸商家设计的电子商务平台,它提供了全面的功能和灵活的自定义选项,帮助企业快速构建自己的在线商店。这个系统的核心特点是开源,这意味着用户可以自由查看、修改和分发源代码,以...

    常见的PHP开源文档管理系统介绍.pdf

    13. KnowledgeTree:这款开源系统专注于知识管理,提供文档版本控制、分层管理以及对多种文件格式的支持,允许自定义文件类型。 14. Owl Intranet Engine:Owl是一个多用户文档管理系统,具备文件夹和文件权限设置...

    cpp-H3是一个使用六边形网格的地理空间索引系统

    《C++实现的H3地理空间索引系统详解》 H3,全称为Hexagon Hierarchical Spatial Index,是一种高效、灵活的地理空间索引系统,它利用六边形网格进行空间数据的组织和管理。H3由Uber开发并开源,为大数据分析、地理...

    java开源监控系统OpenTSDB.zip

    开源监控系统OpenTSDB,用hbase存储所有的时序(无须 采样)来构建一个分布式、可伸缩的时间序列数据库。它支持秒级数据采集所有metrics,支持永久存储,可以做容量规划,并很容易的接入到现有的报警系 统里。...

    开源文档管理系统LogicalDOC v6.4.1

    LogicalDOC是一个采用Java开发的基于网页的文档管理系统,提供了快速的索引功能和基于浏览器的查询功能。易于使用和学习。它利用最佳的Java技术,实现了强大而灵活的解决方案。为用户提供了强大的搜索引擎(基于...

    ASP.Net开源博客系统

    ASP.NET开源博客系统是一个基于微软的ASP.NET技术构建的、高度可定制的、免费的博客平台,用于个人或团队发布内容、分享见解和知识。它以其功能强大、易用性和可扩展性受到开发者和用户的欢迎,是学习ASP.NET开发的...

    PHP大嶝开源微博系统

    搜索功能对于微博系统来说必不可少,PHP大嶝开源微博系统可能会实现全文搜索,利用如MySQL的全文索引或者Solr、Elasticsearch等搜索引擎技术,以提供快速准确的关键词查找。 另外,为了增强社区互动,系统可能会...

    xindy - A Flexible Indexing System-开源

    《xindy:一款灵活的开源索引系统》 在信息技术领域,索引处理是文档组织和检索的关键环节,尤其对于大型和技术性较强的文档而言。xindy,作为一个强大的开源索引系统,为各种文档格式提供了系统自动生成类似书籍的...

    jsp+mysql开源图书馆管理系统

    4. 性能优化:通过合理的索引设置、缓存策略以及数据库连接池管理,提高系统响应速度和并发处理能力。 总的来说,"jsp+mysql开源图书馆管理系统"凭借其简洁的架构和强大的功能,为图书馆的日常运营提供了便利。开源...

    php婚恋交友系统源码_金媒婚恋交友系统开源版v9.2旗舰版的伪静态规则文件

    在婚恋交友系统中,伪静态技术的应用有助于提升用户体验,使用户更容易记住网址,同时也有助于搜索引擎的爬取和索引。 二、金媒婚恋交友系统开源版V9.2旗舰版伪静态规则 1. Apache配置: 在Apache环境中,我们...

    数据收集和索引系统Moloch.zip

    moloch是一个开源的、大型的IPv4 PCAP,用于索引和收集数据库系统。Moloch目的并不是替换IDS引擎,而是它们一起工作,以标准PCAP的格式来存储和索引所有网络流量,提供快速访问。Sessions TabSPI View Tab

Global site tag (gtag.js) - Google Analytics