`
awenhaowenchao
  • 浏览: 71973 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

创建自己的第一个垂直搜索引擎遇到的问题

阅读更多
开发环境:ununtu10.04 Eclipse3.6 mysql5.1 tomcat6.0.29
所用技术:Spring3.0+servlet2.5+jsp+jquery+ibatis2.x+lucene3.x+heritrix1.4



由于以前使用windows开发,这次使用linux开发期间遇到了一些小问题,在这里一一列出



环境问题:
Eclipse3.6默认支持servlet3.0,那么需要tomcat7,但是在本人机器上Eclipse集成Tomcat7有一些问题,只能集成tomcat6了,这里需要修改一个配置


将*.core,xml中的jst.web由3.0修改为2.5,那么接下来可以顺利集成tomcat6了

接下来是mysql的问题,以前仅在windows上使用mysql,这次使用linux结合mysql,由于是自动安装,有些设置不能像window上那样设置
sudo apt-get install mysql-server等,工程统一编码为UTF-8,而mysql安装后默认为latin1
可以使用命令show variables like 'char%'查看这里需要经出filesystem以外的所有配置修改为utf-8,到/etc/mysql/my.inf文件中在
[client]
[mysqld]
选项下设置default-character-set为utf-8,至此乱码问题解决



由于使用的lucene3.0部分api发生了很大的变动,现在只做了第一个版本,后续版本的更新中会增加对源码的认识和代码发布

  • 大小: 130.7 KB
  • 大小: 142.9 KB
  • 大小: 166.3 KB
分享到:
评论

相关推荐

    垂直搜索引擎介绍(MPL实验室)

    垂直搜索引擎是一种专注于特定领域或特定信息类型的搜索工具,与通用搜索引擎相比,它具有更高的专业化和针对性。MPL实验室的垂直搜索项目旨在解决如美食搜索等特定场景下的信息获取问题,提高搜索效率和用户体验。 ...

    育儿类垂直搜索网站商业计划书(PPT32页).pptx

    这个平台旨在成为行业内首屈一指的育儿服务网站,目标是成为第一个育儿类垂直搜索网站,并期望在Alexa排名中进入前1000位。其战略基点在于提供最简洁的用户体验,满足用户育儿需求,并创建可持续的盈利模式。 市场...

    (final)垂直电商的第二引擎——2021垂直类电商私域化洞察报告-30.pdf

    【垂直电商私域化洞察】2021年的垂直类电商正面临新的挑战与机遇。在用户渗透率接近饱和、网上零售额...通过深入挖掘用户需求,建立信任关系,以及创新内容营销,垂直电商有望在这个新的发展阶段找到其“第二引擎”。

    网络爬虫-Python和数据分析.pdf

    此外,爬虫技术也被用于创建垂直搜索引擎,这些搜索引擎专注于特定领域,如招聘网站,可以从多个来源收集数据,如51job.com、zhaoping.com和chinahr.com。 在学习和实践中,Python社区提供了丰富的资源,包括书籍和...

    第5章Web1.0时代新媒体的主要形态.ppt

    **搜索引擎面临的问题**包括: - 缺乏对检索词汇的有效控制。 - 自动标引存在局限,可能无法准确理解网页内容。 - 在专业信息检索方面能力有限。 - 缺乏对信息质量的把关,可能导致低质量内容的传播。 **互联网信息...

    电子商务案例分析第二章.doc

    本章节将深入探讨几个关键知识点,包括Google与百度的对比、垂直搜索引擎与综合搜索引擎的商业模式分析,Google在中国的本土化策略,以及奇搜网与奇虎网的商业模式比较,最后还会讨论265上网导航的商业模式及其潜在...

    互联网研究:影视搜索业务介绍与前景分析(ppt40).pptx

    在竞争格局方面,我们面临来自综合搜索引擎类(如百度影视)、垂直搜索引擎类(如91电影网、环球影视资料库)和种子搜索类(如BT990、VERYCD)的竞争。每种类型的竞争对手都有其优势和劣势。例如,综合搜索引擎内容...

    浅谈网站运营技巧,作为网站运营者,每天都面临着各种各样的挑战,不管是网站自身的因素还是外来的压力,但是在我们的网站的日常运营维护中作上当然需要一些技巧

    网站运营者可以从网页类游戏、垂直搜索引擎、婚恋网站等热门的网站形态中获取灵感。比如说传统的网络游戏己经大行其道,而网页游戏以其方便的玩法,适合白领,不用下载客户端等优势而迅速找到很好的发展空间。婚恋类...

    电子商务与企业博客(1).ppt

    2004年至2006年,电子商务再次繁荣,以携程、易龙和前程无忧为代表的垂直行业网站上市,搜索引擎成为热点,WEB2.0的兴起,尤其是博客的出现,标志着互联网第二个高潮的到来。 浙江的电子商务发展尤为突出,早期以...

    做SEO的方向和心态ppt.ppt

    - 标题:关键词应出现在页面标题中,作为页面的第一印象。 - 关键词和描述标签:简洁明了地概述页面内容,关键词URL内可使用英文形式。 - 内容:自然融入关键词,首次出现时加粗强调。 - 锚文本:内部链接使用...

    网站说服力 1-3.ppt

    例如,针对“网站没有流量”的问题,可以提出投放搜索引擎广告、执行SEO、进行电子邮件营销或投放垂直门户广告等方案。然后对这些方案进行优劣分析,根据企业资源、成本和风险进行权衡,最后选择最佳方案并克服决策...

    非常好看的HTML5 Bootstrap搭建的后台管理系统模板

    首先,HTML5(超文本标记语言第五版)是网页内容的主要结构语言,它在HTML4的基础上进行了许多增强,提供了更好的语义化标签,如、、等,使页面结构更加清晰,有利于搜索引擎优化和无障碍访问。此外,HTML5还引入了...

    广告网络培训模板PPT学习教案.pptx

    2. 搜索联盟:由搜索引擎运营商创建,整合大量中小网站和部分门户网站的剩余广告资源,采用CPC(按点击付费)计费。典型的例子有百度联盟、谷歌AdSense和搜狗联盟。 3. 第三方联盟:由非企业主和搜索引擎的其他第三...

    广告网络培训模板1PPT课件.pptx

    效果广告网络主要是由企业自行建立的联盟、搜索引擎运营商创建的搜索联盟,以及第三方公司运营的联盟。这些联盟以不同的计费模式(如CPS、CPL、CPA、CPM、CPC)吸引广告主,将广告投放到中小网站、个人站点或博客等...

    基于Python的网络爬虫-开题报告.pdf

    网络爬虫是一种自动化程序,用于抓取互联网上的大量信息,构建索引,以便进行数据分析或建立搜索引擎。在当前互联网环境中,动态网页技术的普及使得网络爬虫面临着新的挑战。动态网页的不可见性、登录验证以及验证码...

    互联网运营策划步骤样本.doc

    1. 行业数据分析:这是策划的第一步,需要收集并分析相关行业的数据,包括市场规模、增长率、竞争态势、消费者行为等。这些数据可以从公开报告、行业研究机构、市场调查公司或搜索引擎获取。了解行业的最新动态和...

Global site tag (gtag.js) - Google Analytics