1,Lucene
http://lucene.apache.org/
2,Sphinx
Sphinx是一个高效的索引系统,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索。Sphinx特别为一些脚本语言设计搜索API接口,如PHP,Python,Perl,Ruby等,同时为MySQL也设计了一个存储引擎插件。速度比
http://www.sphinxsearch.com/
3,Hyper Estraier
http://hyperestraier.sourceforge.net/
4,DataparkSearch Engine
http://www.dataparksearch.org/
5,FirteX
中科院开发的一个功能强大、高性能、灵活的全文索引和检索平台。 FirteX 的主要目标是研究文本索引的快速构建 (Index Construction) ,动态文档集的索引维护 (Index Maintenance) ,短语查询 (Phrase Query),Top-k 查询的快速处理 (Top-k Query Process) 以及各种检索模型( IR Model )等。高性能和灵活的架构也使 FirteX 可以应用在产品搜索,桌面搜索,站内搜索,新闻搜索, Blog 搜索,学术搜索以及大规模搜索引擎等领域中。主要特点是基本类结构模仿了LUCENE,在合并索引等方面有所创新,实现了所谓DBT的动态平衡树来进行索引合并管理,很是提高了性能。
http://www.firtex.org/
6,Xapian
C++开发的概率信息检索库,强大的功能,实现范例为 Omega
现支持:Perl, Python, PHP, Java, TCL语言
主页: http://www.xapian.org/
7,MG-1.2.1
Ref: Managing Gigabytes: Compressing and Indexing Documents and Images
http://www.cs.mu.oz.au/mg/
8,Egothor
java信息检索库,捷克人Leo Galambos为开发主理,应用在Capek
http://www.egothor.org/
分享到:
相关推荐
Pilosa 是一个高度可扩展的开源索引系统,它使用了 Go 语言进行开发,专为快速数据处理和分析而设计。这个压缩包“pilosa-pilosa.zip”包含的是 Pilosa 项目的源代码,版本可能是“pilosa-master”,意味着它是主...
此外,系统还可能采用了MySQL作为数据库,通过优化的SQL查询和索引设计,提高了数据访问效率。同时,系统的安全性也是不容忽视的一环,包括防止SQL注入、XSS攻击等安全措施,保障了用户数据的安全。 在文件列表中,...
开源OA系统是一款基于开源技术构建的企业办公自动化解决方案,旨在提高企业内部的工作效率和协同能力。其核心特性包括但不限于文档管理、工作流程自动化、任务分配、会议安排、公告通知以及电子邮件集成等。这款系统...
1. **性能优化**:通过缓存策略、数据库索引、异步处理等方式提高系统性能。 2. **安全性**:考虑XSS、CSRF等安全问题,使用HTTPS加密传输,加强身份验证和授权机制。 3. **国际化与本地化**:支持多语言,为不同...
Nachos是一个开源的操作系统教学平台,它为学生提供了理解和实现操作系统基本概念的机会。在这个实验中,我们面对的任务是扩展Nachos的文件系统,引入二级索引来提高文件查找的效率。 在传统的文件系统中,如FAT或...
在系统设计时,需要合理设计数据库表结构,确保数据的一致性和完整性,同时考虑性能优化,如索引的创建和查询的优化。 开源社区系统的设计通常包含以下几个主要模块: 1. 用户模块:包括用户注册、登录、个人信息...
总的来说,【网络蜘蛛Webspider开源系统】是一个功能全面、技术先进的网络爬虫框架,它结合了高效的消息队列、分布式存储、强大的去重策略以及灵活的索引方案,为开发者提供了强大而易用的网页抓取工具。对于希望...
作为国内最知名的Java开源CMS系统,我们一直秉承开源、易用、高性能、安全的系统开发原则,并以作国内优秀的开源网站管理系统为己任,始终坚持不懈地为用户提供强大的Java技术web应用服务。 JEECMS v2.4.2 正式版...
Red-Piranha是一款开源的搜索系统,专为高效、可扩展和高度自定义的全文检索与数据挖掘设计。它提供了一整套强大的工具和技术,帮助用户处理大量数据并快速找到所需信息。开源软件的优点在于其透明性、社区支持和...
Easycart外贸开源系统是一款专为外贸商家设计的电子商务平台,它提供了全面的功能和灵活的自定义选项,帮助企业快速构建自己的在线商店。这个系统的核心特点是开源,这意味着用户可以自由查看、修改和分发源代码,以...
13. KnowledgeTree:这款开源系统专注于知识管理,提供文档版本控制、分层管理以及对多种文件格式的支持,允许自定义文件类型。 14. Owl Intranet Engine:Owl是一个多用户文档管理系统,具备文件夹和文件权限设置...
《C++实现的H3地理空间索引系统详解》 H3,全称为Hexagon Hierarchical Spatial Index,是一种高效、灵活的地理空间索引系统,它利用六边形网格进行空间数据的组织和管理。H3由Uber开发并开源,为大数据分析、地理...
开源监控系统OpenTSDB,用hbase存储所有的时序(无须 采样)来构建一个分布式、可伸缩的时间序列数据库。它支持秒级数据采集所有metrics,支持永久存储,可以做容量规划,并很容易的接入到现有的报警系 统里。...
LogicalDOC是一个采用Java开发的基于网页的文档管理系统,提供了快速的索引功能和基于浏览器的查询功能。易于使用和学习。它利用最佳的Java技术,实现了强大而灵活的解决方案。为用户提供了强大的搜索引擎(基于...
ASP.NET开源博客系统是一个基于微软的ASP.NET技术构建的、高度可定制的、免费的博客平台,用于个人或团队发布内容、分享见解和知识。它以其功能强大、易用性和可扩展性受到开发者和用户的欢迎,是学习ASP.NET开发的...
搜索功能对于微博系统来说必不可少,PHP大嶝开源微博系统可能会实现全文搜索,利用如MySQL的全文索引或者Solr、Elasticsearch等搜索引擎技术,以提供快速准确的关键词查找。 另外,为了增强社区互动,系统可能会...
《xindy:一款灵活的开源索引系统》 在信息技术领域,索引处理是文档组织和检索的关键环节,尤其对于大型和技术性较强的文档而言。xindy,作为一个强大的开源索引系统,为各种文档格式提供了系统自动生成类似书籍的...
4. 性能优化:通过合理的索引设置、缓存策略以及数据库连接池管理,提高系统响应速度和并发处理能力。 总的来说,"jsp+mysql开源图书馆管理系统"凭借其简洁的架构和强大的功能,为图书馆的日常运营提供了便利。开源...
在婚恋交友系统中,伪静态技术的应用有助于提升用户体验,使用户更容易记住网址,同时也有助于搜索引擎的爬取和索引。 二、金媒婚恋交友系统开源版V9.2旗舰版伪静态规则 1. Apache配置: 在Apache环境中,我们...
moloch是一个开源的、大型的IPv4 PCAP,用于索引和收集数据库系统。Moloch目的并不是替换IDS引擎,而是它们一起工作,以标准PCAP的格式来存储和索引所有网络流量,提供快速访问。Sessions TabSPI View Tab