-
急求帮忙调试lucene+heritrix垂直搜索引擎的设计15
运行ProductTextFileProcessor后控制台提示
F:\product\mobile\Palm-Treo-700p-1274165637841.txt
Exception in thread "main" java.lang.ClassFormatError: Truncated class file
at java.lang.ClassLoader.defineClass1(Native Method)
at java.lang.ClassLoader.defineClass(ClassLoader.java:621)
at java.security.SecureClassLoader.defineClass(SecureClassLoader.java:124)
at java.net.URLClassLoader.defineClass(URLClassLoader.java:260)
at java.net.URLClassLoader.access$000(URLClassLoader.java:56)
at java.net.URLClassLoader$1.run(URLClassLoader.java:195)
at java.security.AccessController.doPrivileged(Native Method)
at java.net.URLClassLoader.findClass(URLClassLoader.java:188)
at java.lang.ClassLoader.loadClass(ClassLoader.java:307)
at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:301)
at java.lang.ClassLoader.loadClass(ClassLoader.java:252)
at java.lang.ClassLoader.loadClassInternal(ClassLoader.java:320)
at oracle.jdbc.driver.T4CDriverExtension.allocateStatement(T4CDriverExtension.java:50)
at oracle.jdbc.driver.PhysicalConnection.createStatement(PhysicalConnection.java:729)
at oracle.jdbc.driver.PhysicalConnection.createStatement(PhysicalConnection.java:697)
at com.backSearch.database.ProductJDBC.getNextId(ProductJDBC.java:66)
at com.backSearch.database.ProductJDBC.addProduct(ProductJDBC.java:28)
at com.backSearch.core.ProductTextFileProcessor.insert2DB(ProductTextFileProcessor.java:135)
at com.backSearch.core.ProductTextFileProcessor.traverse(ProductTextFileProcessor.java:124)
at com.backSearch.core.ProductTextFileProcessor.process(ProductTextFileProcessor.java:67)
at com.backSearch.core.ProductTextFileProcessor.main(ProductTextFileProcessor.java:177)
Palm-Treo-700p-1274165637841.txt为解析到得页面信息txt。
求熟悉lucene+heritrix垂直搜索引擎的高手联系我,由于工程包有点儿大没法发上来,有意解决问题的请加我QQ174271678.
邮箱chenhao_xiong@163.com.2010年5月19日 11:58
目前还没有答案
相关推荐
《搜索引擎Lucene+Heritrix(第二版)4》是一本深入探讨搜索引擎技术的专业书籍,主要围绕两个核心组件——Lucene和Heritrix展开。Lucene是Apache软件基金会的一个开源全文检索库,而Heritrix则是一个网络爬虫工具,...
《开发自己的搜索引擎——Lucene+Heritrix》是一本深入探讨如何构建自定义搜索引擎的书籍,结合了Apache Lucene和Heritrix两个强大的开源工具。Lucene是Java开发的全文检索库,而Heritrix则是一款功能丰富的网络爬虫...
在这个过程中,Lucene 和 Heritrix 是两个非常关键的工具,它们分别在搜索引擎的构建中扮演着不同的角色。 首先,Lucene 是一个基于 Java 的开源信息检索库,它为开发者提供了一系列用于构建搜索引擎的工具和接口。...
在探究如何使用Lucene和Heritrix构建搜索引擎之前,我们需要了解这两个工具分别扮演的角色及其在搜索引擎开发中的作用。 Lucene是一个高性能、可伸缩、可扩展的全文检索库,它是用Java编写的开源项目。Lucene的目的...
《开发自己的搜索引擎——Lucene+Heritrix(第2版)_随书光盘.rar》是一个包含资源的压缩包,主要用于帮助读者深入理解并实践搜索引擎的开发。Lucene和Heritrix是两个重要的开源工具,它们在构建搜索引擎的过程中起着...
除了Lucene和Heritrix之外,开发搜索引擎还需要掌握其他一些技能和知识点,比如网络协议的理解、服务器和数据库的使用、数据存储技术、编程语言(尤其是Java)的熟练运用等等。此外,搜索算法的设计和优化也是一个...
开发自己的搜索引擎---Lucene+Heritrix(第2版)。超星导出来的,非常清晰。CSDN上传限制60MB,点击我的用户名查看part2。
《开发自己的搜索引擎lucene+heritrix(第2版)》是一部深入探讨搜索引擎开发的专业书籍,主要聚焦于开源项目Lucene和Heritrix的使用。Lucene是Java编写的一个全文检索库,而Heritrix则是一个互联网档案爬虫,两者...
这里我们关注的是基于开源项目Lucene 2.0和Heritrix的一本书——《开发自己的搜索引擎》的源码资料。Lucene是一个高性能、全文本搜索库,而Heritrix则是一个强大的网页抓取工具,它们共同构成了搜索引擎的基础架构。...
在这个项目中,我们将使用Apache Lucene和Heritrix这两个开源工具来开发我们自己的搜索引擎。Apache Lucene是一个强大的全文搜索引擎库,而Heritrix则是一个功能丰富的网页抓取器,用于收集互联网上的数据。接下来,...
Lucene和Heritrix是两个在信息技术领域中用于搜索引擎构建的重要工具。Lucene是一个高性能、全文本搜索库,由Apache软件基金会开发,它提供了一个简单的API来索引和搜索大量文本数据。Heritrix,另一方面,是一个...
开发自己的搜索引擎 Lucene Heritrix 第2版
《搜索引擎Lucene+Heritrix(第二版)2》是一本深入探讨搜索引擎技术的专业书籍,主要围绕两个核心组件——Lucene和Heritrix展开。Lucene是Apache软件基金会的一个开源全文检索库,而Heritrix则是一个强大的网络爬虫...
### 基于Lucene_Heritrix的垂直搜索引擎的研究与应用 #### 一、垂直搜索引擎的基本介绍 垂直搜索引擎是一种专注于特定领域或特定主题的信息检索工具。与通用搜索引擎相比,垂直搜索引擎更加聚焦,旨在为用户提供...
《搜索引擎Lucene+Heritrix(第二版)》是一本深度探讨搜索引擎技术的书籍,主要聚焦于开源项目Lucene和Heritrix。Lucene是Java实现的全文搜索引擎库,而Heritrix则是一个网络爬虫工具,两者结合为构建自定义搜索...
《开发自己的搜索引擎——Lucene+Heritrix(第2版)》是一本深入探讨如何构建搜索引擎的专著,其中包含了Lucene和Heritrix两个关键工具的详细使用指南。这本书旨在帮助开发者理解搜索引擎的工作原理,并提供实践性的...
- **垂直搜索引擎**:Heritrix 可以针对特定领域或主题进行数据抓取,结合 Lucene 的强大搜索能力,可以构建出针对性强、效率高的垂直搜索引擎。 #### 四、总结 通过使用 Lucene 和 Heritrix,我们可以构建一个...
《开发自己的搜索引擎--Lucene+Heritrix》这本书是中国首部深入探讨搜索引擎开发的专业书籍,其内容涵盖了从理论到实践的全面知识体系。书中重点介绍了两个核心工具:Apache Lucene和Heritrix,它们在搜索引擎开发...
《搜索引擎Lucene+Heritrix(第二版)3》是一本深入探讨搜索引擎技术的专业书籍,主要聚焦于两个关键组件:Apache Lucene和Heritrix。Lucene是Java开发的全文检索库,而Heritrix是一款开源的网络爬虫工具。这两者在...
《搜索引擎Lucene+Heritrix(第二版)7》是一本深入探讨搜索引擎技术的专业书籍,其配套光盘包含了丰富的学习资源。在这个主题中,我们将主要关注两个核心组件:Lucene和Heritrix。 Lucene是Apache软件基金会的一个...