`
文章列表
庖丁中文分词需要一套词典,这些词典需要统一存储在某个目录下,这个目录称为词典安装目录。词典安装目录可以是文件系统的任何目录,它不依赖于应用程序的运行目录。将词典拷贝到词典安装目录的过程称为安装词典。增加、删除、修改词典目录下的词典的过程称为自定制词典。 在linux下,我们可以考虑将词典安装在一个专门存储数据的分区下某目录,以笔者为例,笔者将/data作为系统的一个独立分区,笔者便是将词典保存在/data/paoding/dic下。 在windows下,我们可以考虑将词典安装在非系统盘的另外分区下的某个目录,以笔者为例,笔者可能将词典保存在E:/data/paoding/dic下。 使用者安装辞 ...
采用基于数据挖掘的算法来实现推荐引擎是各大电子商务网站、SNS社区最为常用的方法,推荐引擎常用Content-Based 推荐算法及协同过滤算法(Item-Based 、User-based)。但从实际应用来看,对于大部分中小型企业来说,要在电子商务系统完整采用以上算法还有很大的难度。 1、常用推荐引擎算法问题 1)、相对成熟、完整、现成的开源解决方案较少粗略分来,目前与数据挖掘及推荐引擎相关的开源项目主要有如下几类:数据挖掘相关:主要包括Weka、R-Project、Knime、RapidMiner、Orange 等文本挖掘相关:主要包括OpenNLP、LingPipe、FreeLing、 ...
来自:http://liuxinglanyue.iteye.com/blog/851972 Lucene3.0 初窥 总结(收藏)   lucene数据结构全文检索框架   【Lucene3.0 初窥】全文检索的基本原理   【Lucene3.0 初窥】Lucene体系结构概述   【Lucene3.0 初窥】文本分析器Analyzer  
    安装Paoding中文分词     转自 博客http://www.cnblogs.com/tjsquall/archive/2009/06/30/1514077.html   1,把paoding-analysis-2.0.4-beta解压缩,给项目中加入paoding-analysis.jar。 2,把dic文件夹放到项目的根目录中。dic文件夹里是paoding的词库。 3,配置paoding的词库:把paoding-analysis-2.0.4-beta\src里面的paoding-dic-home.properties拷贝到项目的根目录下。编辑如下: ...
迁移过程中遇到两种Microsoft OLE DB Provider for Oracle与Oracle Provider for OLEDB访问接口;个人建议使用Oracle Provider for OLEDB接口简单快捷; 其中有一个问题困扰很久的是链接服务器中没有Microsoft OLE DB Provider for Oracle选项,是因为通过sql server2005的客户端去连接的,而sql server2005 服务端才提供这个选项; 1。建立链接服务器使用Microsoft OLE DB Provider for Oracle访问接口   查询oracle的 ...
机器上配置的JDK为1.6,SQL2005/2008,而JDBC Driver一直用 Microsoft SQL Server 2005 JDBC Driver 1.2 ,支持sql2000/sql2005/sql2008,下载地址:http://www.microsoft.com/downloads/details.aspx?familyid=C47053EB-3B64-4794-950D-81E1EC91C1BA&displaylang=zh-cn   今天试了下 ...
最近学Oracle,正好单位OA中Word文件是将文件用BASE64方式编码后用CLOB型写入数据库的,因此有心测试JDBC对CLOB型的操作(百度的排版好像不太好用,凑合看吧)。准备工作:一、去http://commons.apache.org/codec/下载BASE64的编解码包二、去http://www.oracle.com/technology/software/tech/java/sqlj_jdbc/htdocs/jdbc_10201.html下载10G以后的ojdbc14.jar,用9i自带的的ojdbc14.jar在使用第二种方法的时候不能超过4000字节三、登录到Oracle, ...
有时候在自己电脑上编译通过的java代码,在别人那里确编译不通过,总是@override报错,把@override去掉就好了,但不能从根本上解决问题。 据说这是jdk的问题,@Override是JDK5就已经有了,但有个小小的Bug,就是不支持对接口的实现,认为这不是Override 而JDK6修正了这个Bug,无论是对父类的方法覆盖还是对接口的实现都可以加上@Override。 首先要确保安装了jdk 1.6, 然后,在eclipse中修改配置,在 Windows->Preferences-->java->Compiler-->compiler complia ...
oracle 10g透明网关组件下载地址,需要oracle注册名   http://www.oracle.com/technetwork/cn/database/10201winsoft-095341-zhs.html
有两个方法 import java.util.regex.Matcher;   import java.util.regex.Pattern;   public class IfHanZi {   public static void main(String[] args) {   //方法一:   String s1 = "我是中国人";   String s2 = "imchinese";   String s3 = "im中国人";   System.out.println(s1 ...
本人xp系统,2G内存的联想本本的解决分成两部分   1.在Eclipse.ini中修改成下面 #showsplash #org.eclipse.platform #launcher.XXMaxPermSize -vmargs -Xms512M -Xmx512M -XX:PermSize=150M -XX:MaxPermSize=150M  2.Myeclipse->preferences->myeclipse->servers->tomcat->tomcat×.×->JDK面板中的 Optional Java VM arguments中 ...
<?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:p="http://www.springframework.org/schema/p" xmlns:aop="http://www.springfra ...
项目需要简单处理一些用户上传的图片,如缩略图、剪切、旋转、水印等。试过很多方法,包括STRUS自带的、jimi、jai等,图片质量不能让人满意。面前在试用JMagick+ImageMagic,比较而言生成缩略图已经很好了,将碰到的一些问题总结下,同志们少走点弯路。 1、jmagick下载 最新的地址http://downloads.jmagick.org/ 这个地址包含了最新的文档和ImageMagic 2、windows下安装 A、ImageMagick选择独立安装版本如 ImageMagick-6.3.9-0-Q8-windows-dll.exe,jmagick-win-6.3.9-Q ...
come from :http://www.cnblogs.com/jokey/archive/2010/07/16/1778742.html 懂点计算机的人都知道,有些软件安装好后开机会自动打开,有时为了节省开机的时间,我们会删除或禁用这些自启动。至于如何删除会有很多方法,例如软件自身可以设置 ...
定时发送邮件:大概是用户选择在某个时间发送邮件; 步骤: 1.我在数据库专用一个数据表A存定时发送邮件的相关内容; 2.在程序中设置一个定时器,每隔一段时间(10秒,20秒或一分钟)去查询该数据表A,匹配它的发送时间;在这个时间内的就拿出来进行发送;发送成功之后的数据进行删除或移走;    
Global site tag (gtag.js) - Google Analytics