- 浏览: 47259 次
- 性别:
- 来自: 成都
最新评论
文章列表
使用server版本。默认情况下ubuntu不自动挂载u盘。
用 fdisk -l 看一下确定设备名和文件系统类型。
为挂载做准备,创建一个目录:
mkdir /media/usb
使用mount挂载设备:
mount -t vfat /dev/sdb /media/usb
或
mount -t ntfs-3g /dev/sdb /media/usb
这时u盘已经挂载,可以访问。
使用完毕后,需要卸载:
umount /dev/sdb
转http://jasonyu.cn/post/328/
ubuntu下nutch-1.0的安装和配置错误排除(原创) 国内部份建立在云计算之上的网站
nutch-乱码解决搜索引擎与人工智 2009-05-13 12:02:49 阅读75 评论0 字号:大中小 订阅
在Nutch的搜索框中输入中文,点击“搜索”按钮之后,可以看到搜索框中的关键字是乱码,搜索结果也为空。网上有很多文章都谈到了这个现象,这不是Nutch的问题,而是Tomcat没有对uri做编码造成的。解决的办法也很简单,在Tomcat的安装目录下找到”conf/server.xml”文件,在"Connector port=”8080″ ”那一节添加URIEnco ...
nutch 抓取动态网页(转)
- 博客分类:
- 搜索引擎
解决搜索动态内容的问题:
需要注意在conf下面的2个文件:regex-urlfilter.txt,crawl-urlfilter.txt
# skip URLs containing certain characters as probable queries, etc.
-[?*!@=] (-改+)
这段意思是跳过在连接中存在? * ! @ = 的页面,因为默认是跳过所以,在动态页中存在?一般按照默认的是不能抓取到的。可以在上面2个文件中都修改成:
# skip URLs containing certain characters as probable queries, etc.
# -[ ...
1,什么是ant
ant是构建工具
2,什么是构建
概念到处可查到,形象来说,你要把代码从某个地方拿来,编译,再拷贝到某个地方去等等操作,当然不仅与此,但是主要用来干这个
3,ant的好处
跨平台 --因为ant是使用java实现的,所以它跨平台
使用简单--与ant的兄弟make比起来
语法清晰--同样是和make相比
功能强大--ant能做的事情很多,可能你用了很久,你仍然不知道它能有多少功能。当你自己开发一些ant插件的时候,你会发现它更多的功能。
4,ant的兄弟make
ant做的很多事情,大部分是曾经有一个叫make的所做的,不过对象不同,make更多应用于c/c++ ,ant更 ...
一、在Tomcat中安装运行Solr
下载Solr包,找到dist文件夹中的appache-solr-1.4.0.war。将它拷贝到tomcat的webapps下,改名为solr.war(之后访问的路径为/solr)。
在webapp下建立同war包名一样的文件夹(这里就是solr),将example/solr下的所有文件拷贝到这个目录下(这里是一些样例的配置)
在tomcat的conf/Catalina/localhost文件夹下面建立solr.xml,设定solr的根目录。
view plaincopy to clipboardprint?
<!--其中的路径都是相对于tomcat ...
现在我们开始研究载入的数据部分(importing data)
在正式开始前,我们先介绍一个存储了大量音乐媒体的网站http://musicbrainz.org ,
这里的数据都是免费的,一个大型开放社区提供。
MusicBrainz每天都提供一个数据快照(snapshot)的SQL文件,这些数据可以被导入PostgreSQL数据库中。
一、字段配置(schema)
schema.xml位于solr/conf/目录下,类似于数据表配置文件,
定义了加入索引的数据的数据类型,主要包括type、fields和其他的一些缺省设置。
1、先来看下type节点,这里面定义FieldTy ...
[size=medium]最近刚忙完一个电影网站,其中的全文搜索的功能我就是用Solr完成的,在此将我在开发中遇到的问题以及怎样解决问题的经验拿出来与大家分享。
我们这个网站有一个站内搜索的功能,例如站内新闻,输入关键字去搜索。数据库里有上万条数据,如果去挨个like,效率会很低,经领导指点,说可以试一试HibernateSearch和Apache solr结合mmseg4j分词进行全文检索,于是我就开始我的Solr之旅。
一开始在网上搜了很多例子拿来入门,首先是分词,mmseg4j是用来分词的,常用的分词分析器有三种:MaxWordAnalyzer(最大分词),SimpleAn ...
需求:
实现SOLR主,辅服务器更新同步,每次客户端COMMIT请求都会及时应用在辅服务器上。
实现MULTICORE,实际生产环境中往往会有多个搜索应用实例。
步骤:
一、 准备条件
服务器准备
准备两台服务器:
一台用作主服务器(192.168.0.36),负责分发索引
另一台负责辅服务器(192.168.0.46),负责承载搜索服务。
2. 软件环境
linux版本不限,32,64位不限
应用容器:TOMCAT 6.0
java版本:JDK1.6以上版本
Solr应用环境目录: /solr/video/ (可使用ln –s ...
====== ======
==== 单个 Solr App ====
* 下载和安装 [[http://tomcat.apache.org/|Tomcat]],Windows 用 MSI 安装。用 tcnative.dll 文件安装它,可以安装到 C:\tomcat 目录。((chenlb注:其实可以用*.zip直接解压就得了))
* 检查安装是否正确,[[http://localhost:8080/]]
* 修改 c:\tomcat\conf\server.xml 文件,在 Connector 元素里加 URIEncoding 属性(UTF-8)。
* 下载和解压 ...
pan_java 写道SOLR技术文档
1. 了解lucene 原理,全文搜索概念,参考(http://wishlife.iteye.com/category/30179) .建立自己的索引库.
2. 了解solr参考(http://www.ibm.com/developerworks/cn/java/j-solr1/, http://www.ibm.com/developerworks/cn/java/j-solr2/).并下载实例程序.
3. 搭建SOLR服务器
3.1 官方下载 apache-solr-1.3.0.zip 和tomcat5.5
3.2 将apache-solr-1.3.0\ ...
Solrj已经是很强大的solr客户端了。它本身就包装了httpCliet,以完全对象的方式对solr进行交互。很小很好很强大。
不过在实际使用中,设置SolrQuery 的过程中,为了设置多个搜索条件和排序规则等等参数,我们往往会陷入并接字符串的地步,实在是很丑陋,不符合面向对象的思想。扩展性几乎为0,。基于这点,开发了一个小东西,我们只需要设置搜索对象,将对象扔给后台就可以了。
比如,我们搭建的solr服务支持某10个字段的搜索,我们要搜索其中的一些,那么我们只需要传入要搜索的对象POJO,将要搜索的字段内容,set到POJO对象对应额字段即可。
比如如下一个类:
p ...
准备:
Tomcat版本:apache-tomcat-7.0.0
Solr版本:apache-solr-1.4.1
开始:解压apache-solr-1.4.1.zip包,解压开目录结构如下:
将apache-solr-1.4.1\example\webapps下solr.war复制到Tapache-tomcat-7.0.0\webapps中;
将apache-solr-1.4.1\example下solr文件夹复制到apache-tomcat-7.0.0\bin下;
部署完成,测试,本地访问:http://localhost:8080/solr/admin/ ,结束如下截图
这篇文章是在写 在 Debian 上源码安装 Xen 的时候一起写的,原本以为 Ubuntu 和 Debian 很相似、差别不大,配置过程可以直接套用而不用大修改,试了才知道其实不是那么简单。Ubuntu 9.10 使用的是 grub 2.0,被证实一些 bug 会导致 Xen ...
FilenameFilter的几种基本用法
- 博客分类:
- java技术
现在假设我们想观看一个目录列表。可用两种方式列出File对象。若在不含自变量(参数)的情况下调用list(),会获得File对象包含的一个完整列表。然而,若想对这个列表进行某些限制,就需要使用一个“目录过滤器”,该类的作用是指出应如何选择File对象来完成显示。
下面是用于这个例子的几段代码:
package IO;
import java.io.File;
import java.io.FilenameFilter;
class ImageFilter implements FilenameFilter{
public boolean isGif(String file ...
Enumeration接口
Enumeration接口本身不是一个数据结构。但是,对其他数据结构非常重要。 Enumeration接口定义了从一个数据结构得到连续数据的手段。例如,Enumeration定义了一个名为nextElement的方法,可以用来从含有多个元素的数据结构中得到的下一个元素。
Enumeration接口提供了一套标准的方法,由于Enumeration是一个接口,它的角色局限于为数据结构提供方法协议。下面是一个使用的例子:
//e is an object that implements the Enumeration interface
while (e.hasMor ...