互联网专栏最新文章

lucene-NGram中文分词

NGram(综合了单词切分和二分法) package busetoken; import java.io.IOException;import java.io.StringReader; import org.apache.lucene.analysis.Token;import org.apache.lucene.analysis.ngram.NGramTokenizer; publi ...
deepfuture 有2739人浏览 2009-12-23 19:00 专栏:lucene等搜索引擎解析

lucene入门-简单的WEB搜索界面

使用servlet和tomcat6,注意事项: 1,将lucene-core-2.9.0.jar复制到WEB-INF\lib 2,按照tomcat的要求组织好目录 3,编写好web.xml 4,编译产生的SluceneSearcher.class类拷到WEB-INF\classes\bservlet web.xml配置如下: <?xml version="1.0&quo ...
deepfuture 有2192人浏览 2009-12-23 18:46 专栏:lucene等搜索引擎解析

lucene入门-使用JE中文分词

基于词库的算法分词,是较好的中文分词器 package busetoken;import java.io.IOException; import jeasy.analysis.MMAnalyzer; public class UseJe { /*** @param args* @throws IOException */public static void main(String[] arg ...
deepfuture 有1815人浏览 2009-12-23 18:45 专栏:lucene等搜索引擎解析

lucene入门-解析pdf(使用pdfbox解析英文PDF)

下载pdfbox http://incubator.apache.org/pdfbox/ 下载相关的jar http://commons.apache.org/downloads/download_logging.cgi 引入external下的所有包 英语PDF: package extract;import java.io.FileWriter;import java.io.IOE ...
deepfuture 有2322人浏览 2009-12-23 18:40 专栏:lucene等搜索引擎解析

lucene入门-解析word文档

下载: http://mirrors.ibiblio.org/pub/mirrors/maven2/org/textmining/tm-extractors/0.4/ java代码如下: package extract; import java.io.*;import org.textmining.text.extraction.WordExtractor; public class Ex ...
deepfuture 有2008人浏览 2009-12-23 18:39 专栏:lucene等搜索引擎解析

lucene入门-解析pdf(使用xpdf解析中文PDF详细过程)

下载xpdf和xpdf-chinese-simplified.tar.gz ,然后将xpdf-chinese-simplified.tar.gz解压到xpdf所在的目录形成一个子目录 http://www.foolabs.com/xpdf/download.html The following packages are available: Arabic: xpdf-arabic.tar. ...
deepfuture 有7609人浏览 2009-12-23 17:27 专栏:lucene等搜索引擎解析

lucene入门-使用pdfbox解析中文PDF

很多人使用 PDFBOX无法解析中文PDF,其实是在编程时没有指定字符集导致的,指定字符集后,pdfbox是完全可以解析中文PDF的 下载JAR文件 下载pdfbox http://incubator.apache.org/pdfbox/ 下载相关的jar http://commons.apache.org/downloads/download_logging.cgi 引入exter ...
deepfuture 有6373人浏览 2009-12-23 17:26 专栏:lucene等搜索引擎解析

lucene-解析xml

1、安装DOM4j http://www.dom4j.org/ 2、安装jaxen http://jaxen.org/releases.html 3、代码 package extract;import java.io.*;import org.dom4j.*;import org.dom4j.io.*;import java.util.*; public class XmlExtract ...
deepfuture 有1702人浏览 2009-12-23 17:19 专栏:lucene等搜索引擎解析

lucene-使用htmlparser解析未设定编码页面

一、 1、使用htmlparser解析网页,如果页面没有设定编码,那么htmlparser将会iso-8859-1和编码方式解析网页 2、本例假定网页没有指定编码,将http://hao.360.cn/ ...
deepfuture 有12077人浏览 2009-12-23 17:17 专栏:lucene等搜索引擎解析

lucene-使用htmlparser解析有编码页面

网页中指定了以下的形式的编码 <META content="text/html; charset=gb2312" http-equiv=Content-Type> 一、使用org.htmlparser.beans.StringBean 1、代码: package extract;import java.io.UnsupportedEncodingExcepti ...
deepfuture 有16733人浏览 2009-12-23 17:15 专栏:lucene等搜索引擎解析

SEO策略 PPC和SEO 关键词竞争性研究

关键词研究是整个SEO活动的核心也是开发PPC程序的关键所在。你应该仔细的挑选效果最好的关键词。因为关键词的选择贯穿于网站的复制,PPC程序以及其他类型的活动之中。   开始之前,你应该知道获取关键词的渠道。   你自身的经验和知识 。从你自身的行业知识,再差也能选择一个词来描述产品或者服务的特征。如果不知道,你最好了解了解你的产品和服务。 你的客户 。你的客户会告诉你,当他们想寻找产品或服务的时 ...
风雪涟漪 有1466人浏览 2009-04-02 16:21 专栏:SEO策略

SEO策略 PPC和SEO 理解PPC对SEO的影响

有很多关于使用自然关键词营销和PPC营销的争论。对于这两种营销方式分别有两大阵营。   第一个阵营的观点是,PPC程序会对自然关键词程序造成不好的影响。PPC程序破坏了自然关键词的排名,因为为关键词付费会降低自然关键词的排名。他们深信这个原则,并且认为PPC根本没有用武之地。   另一阵营的观点是,PPC对SEO没有效果。这个观点相信对自然关键词优化能和PPC效果一样。所以没必要在PPC上花钱。   ...
风雪涟漪 有1548人浏览 2009-04-02 10:13 专栏:SEO策略

SEO策略 PPC和SEO PPC分类

所有的ppc程序并不都是一样的。当你想到ppc程序的时候,有可能会联想到关键词营销-关键词竞价决定了网站在搜索引擎结果页面中的排名。因为它们适用于关键词,所以就是PPC营销程序的准确描述。但是还有其他两种PPC程序。你可能会发现目标定位于不同种类的PPC程序,效果要好于单一的关键词PPC程序。   基于关键词的PPC程序 基于关键词的PPC程序是最广泛的PPC程序了。本文章也是着重讲解这个类型。你已 ...
风雪涟漪 有1624人浏览 2009-04-01 23:13 专栏:SEO策略

SEO策略 PPC和SEO 应用PPC

PPC的应用 ppc本身就是广告,通过购买关键词或短语的方式来买搜索引擎的位置。   第一种方式,你为搜索结果页面的排名而付费。在很多的案例中,你 ...
风雪涟漪 有1246人浏览 2009-04-01 17:17 专栏:SEO策略

SEO策略 (十二) 关键词 什么是正确的关键词密度

什么是正确的关键词密度 关键词的密度挺难衡量的。关键字词密度是指一张网页的所有文字中关键字词出现的次数的百分比。因此如果有一个1000个词的页面。一个关键词出现在页面有10次,这个关键词密度就是1%。   那么什么是正确的关键词密度呢?这个问题还真没法回答。一些专家说关键词密度应该在5%到7%之间。有的人认为要比低一些或高一些。好像没有一个准确的答案。   因为关键词密度没有啥准确的答案,甚至有的时 ...
风雪涟漪 有1245人浏览 2009-03-05 14:13 专栏:SEO策略

SEO策略 (十一) 关键词 挑选合适的关键词

关键词是SEO的基石。关键词是影响排名因素中占了很大的一部分。也决定了用户是否能找到你的网站。因此当选择关键词的时候,希望选择正确的词汇。 ...
风雪涟漪 有1197人浏览 2009-03-04 17:49 专栏:SEO策略

[Ray Linn]用Visual Studio 2008开发IE BHO(浏览器帮助对象) 之三

接下来,我们要为IE增加一个按钮(注意不是toolbar,toolbar要复杂得多),基本这是一个注册表的魔术.打开RayBHO.rgs, 添加 HKLM { NoRemove Software { NoRemove Microsoft { NoRemove 'Internet Explorer' { NoRemove Extensions ...
ray_linn 有4684人浏览 2009-03-03 18:06 专栏:用Visual Studio 2008开发IE BHO (浏览器帮助对象)

[Ray Linn]用Visual Studio 2008开发IE BHO(浏览器帮助对象) 之二

原文发表于blogs.ejb.cc,版权为Ray_linn所有。 上一篇文章开发的RayBHO只是BHO的一个框架,根本不具备任何功能. 在这篇文章里,我们将使继续扩展这个BHO,让 ...
ray_linn 有4805人浏览 2009-03-03 16:19 专栏:用Visual Studio 2008开发IE BHO (浏览器帮助对象)

[Ray Linn]用Visual Studio 2008开发IE BHO (浏览器帮助对象)之一

这篇文章是应同学们的要求写的,以前都是用VC++ 6.0+Platform SDK完成的. 迁移到 VS2008之后,原来Visual Studio 6.0里的BHO向导不复存在,因此特此不厌其烦,详细说明 ...
ray_linn 有9275人浏览 2009-03-03 14:46 专栏:用Visual Studio 2008开发IE BHO (浏览器帮助对象)

SEO策略 (九) 关键词 理解启发式

理解启发式 如果你要维护一个对搜索引擎最优化的网站,你应该对启发式并不陌生。这个术语做为一个认知的模式以及被用来解决问题的或者用已知的某一模式去快速而高效的得出结论。 上面的话有些复杂,简单的来说就是一个解决问题的方法,虽然在某些时候这些方法并不是很准确的。启发式对搜索引擎优化是如此的重要,因为这些搜索引擎允许用户用不同的方式来搜索,如特殊的关键词或者短语。 让我们看个例子,如你在 ...
风雪涟漪 有1387人浏览 2009-03-03 11:48 专栏:SEO策略

互联网热门专栏

更多专栏>>

互联网热门文章

博客专栏评论

...
zl378837964 评论了 美团在Redis上踩过的一些坑-目录(本人非 ...
写的很是清楚了,我找到一份中文协议:https://mcxiaoke.gitbooks.io/mqtt ...
ipodao 评论了 MQTT入门(6)- 主题Topics
还行
Cavani_cc 评论了 MQTT入门(6)- 主题Topics
学习学习
jinmh716 评论了 Git 版本控制工具介绍(一)
请问从哪里看出慢查询的,怎么查找的能具体说说嘛
sunnyhappylg 评论了 慢查询引起的redis-clusterdown
分享一款代码生成器,拖拽式组件结合流式处理,很容易的访问数据库、http、文件读写操作等等,支持编写j ...
MCLoginandPwd 评论了 git文件存储原理解析(八)
分享一款代码生成器,拖拽式组件结合流式处理,很容易的访问数据库、http、文件读写操作等等,支持编写j ...
MCLoginandPwd 评论了 spring-data-jpa原理探秘(4)-JpaQueryE ...
什么时候用dockerfile build image,什么时候拉取镜像?
ming1259 评论了 30天了解30种技术系列(15)----Docker多容器 ...
yanan0628 写道 爷大帝
carlosfu 评论了 Redis-Cluster实战--5.使用redis-cli安装
...
yanan0628 评论了 Redis-Cluster实战--5.使用redis-cli安装
Global site tag (gtag.js) - Google Analytics