一。JCC的安装(参考http://lucene.apache.org/pylucene/jcc/documentation/install.html,并自己实践!)
1. 安装gcc、make和python2.5
首先我用的是debian系统。由于这次安装很多都是用C或者C++写的,要编译安装,所以最基本的gcc和make要先安装
简单的就可以用atp-get install gcc make安装了。python就不用说了。
2.安装setuptools
由于JCC安装要用到setuptools,所以需要把这个先搞定。可以到http://pypi.python.org/pypi/setuptools下载合适的版本的egg文件。我下的是setuptools-0.6c11-py2.5.egg ,然后运行sh setuptools-0.6c11-py2.5.egg就可以了。不过这个setuptools是
有bugs的,待会jcc会告诉你怎么用patch处理这个bug
3.安装jdk
sudo apt-get install sun-java5-jdk
sudo update-java-alternatives -s java-1.5.0-sun
4.安装python2.5-dev
由于JCC在编译的时候要用到Python.h和一些python的头文件要被include进去。所以要安装python的dev包
sudo apt-get install python2.5-dev
5.修改jcc目录下的setup.py文件,把JDK这个变量 对应的值改成你系统上的值。
原来默认的是这样的:
JDK = {
'darwin': '/System/Library/Frameworks/JavaVM.framework/Versions/Current',
'ipod': '/usr/include/gcc',
'linux2': '/usr/lib/jvm/java-6-openjdk',
'sunos5': '/usr/jdk/instances/jdk1.6.0',
'win32': 'o:/Java/jdk1.6.0_02',
}
但是我的jdk安装在/usr/lib/jvm/java-1.5.0-sun,所以我把linux2的值改成/usr/lib/jvm/java-1.5.0-sun这个了。
保存退出就行了。
6.正式安装jcc
运行:
python setup.py build
sudo python setup.py install
中间会出现要修复setuptools引起的bug的提示,按着做就是了。
------------------------------------------------------------------------------------------------------------
至此JCC安装完毕。写出这个的原因是自己安装过程耗掉了比预想中要多的时间,所以share出来,让其他人尽可能少走弯路。
二。安装pylucene
1.安装Ant
由于pylucene中的Makefile用到ant的命令,所以需要先安装ant
sudo apt-get install build-essential ant
就可以了。
2.修改Makefile
这个文件里面需要定义一些变量,里面说的很清楚的,只要你把对应你自己系统的变量前的#去掉就可以了。
由于我的是linux,python是2.5
所以我打开的是:
PREFIX_PYTHON=/usr
ANT=ant
PYTHON=$(PREFIX_PYTHON)/bin/python2.5
JCC=$(PYTHON) -m jcc --shared
NUM_FILES=2
修改完以后运行
make
make install
完了......
三。测试pylucene
进入samples文件夹,运行其中一些文件就可以试出是否安装成功了!
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
终于把pylucen安装好了,接下来就是使用它了,继续好好学习!
分享到:
相关推荐
在安装过程中,需要确保系统已经安装了JCC(Java to Python Compiler),这是PyLucene编译和运行的必要组件。通过执行构建脚本,PyLucene会生成Python模块,这些模块可以直接导入到Python项目中使用。 在Lucene中,...
在实际使用中,开发者需要下载解压"pylucene-7.7.1.rar",然后按照官方文档的指示进行安装和配置。在Python环境中导入PyLucene模块,便可以开始构建自己的文本搜索系统。通过实践和学习,开发者可以掌握如何利用...
安装环境: Python: Python 3.6 Ubuntu: Ubuntu 18.04.4 LTS Pylucene: Pylucene-8.1.1 1. 下载Pylucene-8.1.1并解压 地址:https://mirrors.tuna.tsinghua.edu.cn/apache/lucene/pylucene/#targz 解压: tar xzvf ...
* jcc #如何使用 * python javaproofread.py -------- 该资源内项目源码是个人的毕设,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! <项目介绍> 1、该资源内项目代码都经过...
文档中详细介绍了如何在ubuntu下面安装solr-4.9.0,以及在安装过程中出现的问题和解决办法
Pylucene是Apache Lucene的Python接口,提供了高效、强大的文本搜索功能。它简化了索引创建和查询的过程,让开发者能专注于数据处理和结果展示。 【Pylucene关键类】 1. **Directory**:负责索引的存储,例如...
请参阅./docs/examples.ipynb ,以与Lucene API进行比较。 Lupyne还基于提供GraphQL和RESTful搜索服务。 注意如果不需要进一步(Python)定制,则Solr和Elasticsearch是基于Lucene的搜索的常用选项。 因此,尽管...
- **使用IndexWriter删除文档**: 使用`indexWriter.deleteDocuments(term)`删除与该Term匹配的所有文档。 - **关闭IndexWriter和IndexReader**: 记得关闭所有打开的资源。 ### 3. Lucene 检索 检索是Lucene的核心...
42. **PyLucene**:用于全文检索的库。 43. **PyCrypto**:提供密码学功能的库。 44. **Paramiko**:一个SSH协议库,支持SFTP等功能。 45. **Pygame**:用于游戏开发的库。 46. **Psyco**:一个Python解释器优化器,...
它利用PRAW进行数据采集,PyLucene建立索引,Flask构建web界面。项目分为数据爬取、建立索引和检索三个阶段。首先,通过PRAW从Reddit子版块中爬取数据;然后,利用PyLucene建立索引,允许创建自定义分析器处理特定的...
除了这些,文档还提到了一些其他的库和工具,如pygccxml、pyparsing、pymacs、idapython、pythonpaimei、pyLucene、wikidpad、Karrigell、标准Python库、PDF处理库、cURL库、urlgrabber、MySQL-Python、pyScripter、...
您需要安装flask,以及pyLucene。 首先,您需要生成数据的文件语料库,这是通过运行 python 文件 file-corpus.py 完成的。 数据输入是来自 Amazon SNAP 数据集的数据文件。 现在生成数据后,我们需要对文件进行...
### Lucene in Action #### 知识点概览 ... - Python 接口 PyLucene。 通过上述内容的学习,读者将能够深入了解 Lucene 的基本概念、核心技术和实际应用案例,从而更好地利用 Lucene 来解决实际搜索问题。
Python提供了许多库来支持信息检索,例如Whoosh、Lucene(Python版本名为PyLucene)和Elasticsearch等。这些库可以帮助我们构建索引,执行查询,并对结果进行相关性排序。 检索增强是一种技术,用于提升信息检索...
- **Python 版本**:虽然没有官方版本,但有一些社区维护的 Python 接口,如 PyLucene。 - **实际案例研究**: - **电子商务网站产品搜索**:通过 Lucene 实现商品名称、描述等字段的全文检索。 - **学术论文...
- PyLucene:Python版本。 这些不同语言版本的Lucene都遵循相同的索引和搜索原则,但在具体实现细节上可能有所差异。 #### 第二章:入门实例 - **工作原理** Lucene的工作流程主要包括以下几步: 1. **文档...