`
ttitfly
  • 浏览: 625453 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论
文章列表
 isAssignableFrom 是用来判断一个类Class1和另一个类Class2是否相同或是另一个类的超类或接口。     通常调用格式是           Class1.isAssignableFrom(Class2)     调用者和参数都是   java.lang.Class   类型。           而   instanceof   是用来判断一个对象实例是否是一个类或接口的或其子类子接口的实例。       格式是:   oo   instanceof   TypeName         第一个参数是对象实例名,第二个参数是具体的类名或接口名 具体例子如下 ...
通过反射机制,获得实际绑定的类型 泛型反射的关键是获取ParameterizedType,再调用它的getActualTypeArguments()方法获得实际绑定的类型 比如: java 代码 package test;       import java.lang.reflect.ParameterizedType;    import java.lang.reflect.Type;       public class Parent<t></t><t></t> < T &g ...

eclipse

    博客分类:
  • java
window->preferences ->General->Editors->File Associations window->preferences->Validation
1.提取关键词及相应的频率 java 代码   RAMDirectory ramDir = new RAMDirectory();           IndexWriter ramWriter = null;           IndexReader ramReader = null;           try {               ramWriter = new IndexWriter(ramDir, analyzer, true);               StringBuffer strBuffer = new Str ...
备忘: window:"\r\n" ,Linux:"\n" String lineSeparator = System.getProperty("line.separator");可以根据不同的操作系统获得相应的换行符
Linux上: 在/usr/tomcat/bin/catalina.sh中加入 export JAVA_OPTS='-Xms[初始化内存大小] -Xmx[可以使用最大内存]' 例如:export JAVA_OPTS='-Xms256m -Xmx512m'   Windows上: 在catalina.bat里设置初始内存和最大内存: set CATALINA_OPTS="-Xms30m -Xmx512m" 检查一下Catalina.bat文件,在每个“%_RUNJAVA%”后面都应该有“%CATALINA_OPTS%” 有的Catalina.bat文件在“%_RUN ...
1.提供自动学习数据,对这些数据进行索引 2。从索引里提取一个2维矩阵列表,写入一个文本文件里。关键性代码如下: java 代码   import java.io.File;   import java.util.HashMap;      import org.apache.log4j.Logger;   import org.apache.lucene.document.Document;   import org.apache.lucene.index.IndexReader;   import org.apache.lucen ...
java 代码   //提取内容关键字! 对关键字重要性做排序 筛选!           TermFreqVector contentFreqVector = reader.getTermFreqVector(docId, "itemContent");           if(contentFreqVector != null){               //生成TermVector ArryList!               List<termvector> contentVectorList = new ...
1。maxBufferedDocs       缓存在内存中的document数目,超过他以后会写入到磁盘 2.   maxFieldLength     一个Field中最大Term数目,超过部分忽略,不会index到field中,所以自然也就搜索不到 3.maxMergeDocs     一般不用设置,,默认值: Integer.MAX_VALUE 4.mergeFactor         a.设置每mergeFactor个document写入一个段,比如每10个document写入一个段         b.设置每mergeFacotr个小段合并到一个大段,比如10个docum ...
lucene支持内存索引:这样的搜索比基于文件的I/O有数量级的速度提升。 http://www.onjava.com/lpt/a/3273,而尽可能减少IndexSearcher的创建和对搜索结果的前台的缓存也是必要的。 Lucene面向全文检索的优化在于首次索引检索后,并不把所 ...
转载: http://blog.csdn.net/xiaodaoxiaodao/archive/2006/09/10/1203959.aspx<o:p></o:p> <o:p></o:p> 关于lucene2.0的创建、检索和删除功能的完整实现<o:p></o:p> <o:p> </o:p> 最近要做一个站内的全文检索功能,主要是针对clob字段的,于是去网上找了点lucene的资料,现在新版本的是2.0.0,网上的例子多是1.4.3的,有些方法已经废弃了,搞了n
(转http://www.blogjava.net/beike/archive/2006/08/10/62694.html) 关于 String的intern() 的用途 及简单测试 近来要加载许多数据库数据到内存, 这些数据有很多是重复的。 在反复测试之后 发现intern() 省了好多内存。 举例如下: 以下是表信息: mysql> select count(*) from t1; +----------+ | count(*)   | +----------+ | 8000        | +----------+ 1 row in set (0.01 sec) ...
org.apache.commons.lang.StringUtils中提供许多有用的字符串操作方法,了解这些方法,我们可以避免许多不必要的重复工作。其中比较有用的几个方法: 检查空字符串: StringUtils.isBlank(String str); StringUtils.isNotBlank(String str); 缩写字符串: String test  =   " This is a test of the abbreviation. " System.out.println( StringUtils.abbreviate( test,  10 ...
Lucene应用(我用的是Lucene2.1.0,有些观点有可能也不太正确) 1.多线程索引,共享同一个IndexWriter对象 这种方式效率很慢,主要原因是因为: java 代码   public void addDocument(Document doc, Analyzer analyzer) throws IOException {   SegmentInfo newSegmentInfo = buildSingleDocSegment(doc, analyzer);   synchronized (this) {   ramSegmentInf ...

lucene2.0

Field.Text(java.lang.String, java.io.Reader) 用new Field(java.lang.String, java.io.Reader)代替 Field.Keyword(java.lang.String, java.lang.String) 用 Field.Keyword(java.lang.String, java.lang.String) 代替 Query query = QueryParser.parse(q, "contents", new StandardAnalyzer ()); 用 QueryParser pars ...
Global site tag (gtag.js) - Google Analytics