目前网上对于Mg4j的资料可是少之又少,自己使用了以下,分享一下吧:
Mg4j简介:
MG4J 是另一个搜索engine 。与Lucene 主要区别是,它提供了cluster 功能,具有更OO的设计方式。
MG4J可以让你为大量的文档集合 构建一个被压缩的全文本索引,通过使内插编码(interpolative coding)技术。 虽然MG4J(Managing Gigabytes for Java)不是一个像Lucene、Egothor和Xapian那样的信息检索库,但是我们相信正在读这本书的每一位软件工程师 都 应该知道它,因为它对构建Java信息检索库提供了低水平的支持。MG4J是在一本很流行的书问世之后被命名的,这本书是由 H.Witten,Alistair Moffat和Timothy所写,名字是《管理十亿字节:压缩并且索引文档和图片》。在使用他们的分布式、可容错的网页爬虫UbiCrawler收集到 大量的网页数据后,它的作者需要一个软件来解析那些收集来的数据,由于这个需求,MG4J诞生了。 MG4J的库提供了优化的类来处理I/O,转化索引文件 的压缩等等。这个项
目的主页是:http://mg4j.dsi.unimi.it/;标记库是免费的、开源的,在LGPL许可的方式发布,当前的版本是0.8.2。
Mg4j使用:
首先去官方网站下载,官网网站:http://mg4j.dsi.unimi.it/,官方网站上有介绍怎么使用,附件附上,这里说明的是另外一种方法:Linux下利用shell脚本和Ruby脚本进行使用Mg4j:
下载indexmail.sh和parsemail.rb,下面是使用方法介绍:
这是一个对邮箱进行索引的MG4J的程序。首先,通过parsemail.rb来分析你的邮箱(这个脚本是Ruby写的,所以要有Ruby环境)这个脚本需要索引名和从标准输入的邮箱信息然后,以上面的索引名为参数运行indexmail.sh最后,开始查询处理器(it.unimi.dsi.mg4j.query.Query)作为参数的所有指标已建立(例如,“mail-textmail-from mail-subject mail-sender”)和尝试一些查询(语法查询是解释的包文件)。
相关推荐
heritrix3项目爬虫中所使用到的一个依赖包,mg4j-1.0.1.jar包,有需要的朋友们,赶紧下载吧, 本人亲测过. 有积分的猿友们,赏个积分,没积分的,关注博主,私信发.
标题"D-Link_DIR-615J_v10.01B04Beta_d3mg"涉及的是D-Link公司的一款无线路由器型号DIR-615J的固件升级文件,版本号为10.01B04Beta。这个固件是用于提升设备性能、修复已知问题和增加新功能的软件更新。"d3mg"可能是...
mg4j-工作台与mg4j基准相比,用于评估BitFunnel性能的Java工具。建造视窗 choco install javachoco install mavenmvn packageTODO:设置JAVA_HOME吗?Linux sudo add-apt-repository ppa:webupd8team/javasudo apt-...
exe4j内置常规的打包功能,你不需要安装,直接单击运行即可使用,您可以选择将编写的程序名称打包问其他的扩展名称,支持设置EXE文件的基础信息,包括名称、来源、数据信息等,让您编写的程序可以及时的发布并执行。...
- JP2、J2C等 #### 二、栅格图像的上传方法 - **栅格图像的上传过程**主要包括以下几个步骤: - **纠正配准**:由于原始栅格地图缺少坐标信息,因此需要通过特定的软件进行配准处理,以确保地图能够准确地叠加在...
exe4j破解版是一款自带jre是通过使用教程进行安装能够帮助你实现java可执行程序jar的生成工具,进而完成jar包转exe,能够帮助用户顺畅的进行java编程工作,节省了大量转换时间是一款便捷快速的转换工具,exe4j创建的...
- 仪器主要组成包括:酒精传感器、AVR单片机MG32、四位数码管显示器、八位独立按键。 - 酒精传感器由气敏电阻QM-J3和电压比较器LM358组成,利用QM-J3对酒精浓度的敏感变化来触发电路状态改变,从而实现检测功能。 ...
4. 增强型模式IGBT:MG150J7KS50是一种N沟道增强型IGBT,需要正向门极电压才能导通。 5. 高速型IGBT:文中提及MG150J7KS50为高速型IGBT,在逆变器阶段能够快速转换状态,这对于要求快速开关频率的应用非常重要。 6...
我们已经研究了J /ψ→η'h1,ηh1[h1为h1(1170)和h1(1380)]和J /ψ→π0b1(1235)0,假设轴向矢量介子是由 伪标量-向量-介子相互作用。 我们从先前的J /ψ→ϕππ,ωππ反应研究中获得了所需的输入。 我们...
接口部分如J1、J4、J8、J10和J11等,包括了各种类型的接口,比如DC JACK和USB接口,这些接口允许开发板与其他设备或电源连接。开关SW3和SWPUSHBUTTON-DPDT等元件用于用户交互,控制电路的通断。 原理图中还有各种...
【MG200/495-QWD型采煤机薄煤层大倾角综采作业关键技术研究】 在煤炭开采领域,薄煤层大倾角综采作业是一项极具挑战性的任务,由于地质条件的限制,传统采煤机往往难以适应这种工况。MG200/495-QWD型采煤机便是为...
- **MG12 评估板 v1 元件放置**:详细说明了元件的位置布局,便于理解和使用。 - **外部 SEGGER J-LINK 调试器选项**:除了集成的调试功能外,还支持外部 J-Link 调试器,提供更高级的调试选项。 #### 4. EFR32MG12...
金钟T-BXB-××-MG-T(P)称重传感器是一种专门用于重量测量的电子设备,其功能和特点主要体现在以下几个方面: 首先,T-BXB-××-MG-T(P)传感器采用了S型拉压式结构设计。这种结构设计使得传感器在受到拉力或者压力...
实验结果显示,当半导体激光剂量分别达到30、60、90和120 J·cm^-2时,耐药MG-63细胞的活性受到影响。其中,60、90和120 J·cm^-2的激光照射组显示出显著的细胞活性降低(P 或P ),细胞增殖受到抑制,并且抑制率...
带有AT&T BLE设备的MG100演示 ... (建议使用J-Link Base或J-Link Base Compact) 编程适配器(建议使用和) 使用二进制进行演示 要仅通过SWD上载二进制文件而不进行构建,请下载并使用以下命令: nrfj
在室温和氩气气氛下,以MgH2和纳米Fe为原料,采用机械合金化(球磨法)制备了Mg2FeH6纳米晶.考察了球磨参数(时间、转速)对产物的影响,对所制备的Mg2FeH6纳米晶的组成、结构和形貌进行了表征,并对其储氢性能... 72.0±3) J
- **J17/JP6开关设置**: 应设置为ON位置。 - **天线连接**: 将黑色天线连接到天线转接线上,如果产品带有外壳,则天线可能已经预先安装。 - **SIM卡安装**: 放入中国移动的GSM SIM卡。 - **上电开机**: 开机后,若...
Java作为一种跨平台的语言,提供了丰富的库支持SNMP编程,比如SNMP4J库。开发者可以利用这些库构建自己的MIB管理应用,与MIB Browser类似的工具。 总结,MIB Browser是网络管理员的重要工具,通过它,我们可以方便...