- 浏览: 203270 次
- 性别:
- 来自: 北京
最新评论
-
毛毛虫小白:
您好,这里说的基于角色标注就是用到了字体位频率表里,在“名字内 ...
介绍一种基于角色标注+字词体位法的人名识别方式-Ansj中文分词 -
assasszt:
请问 能不能加入写入文件功能,不然的话 是每次 执行 都是一个 ...
Java版本的BloomFilter (布隆过滤器) -
lhj_6270:
楼主不错。果然不是一般人。再接再厉弄个软件出来。
Java版本的BloomFilter (布隆过滤器) -
ansjsun:
fncj 写道你好,我们最近要搞一个人名识别功能,发现有两个问 ...
介绍一种基于角色标注+字词体位法的人名识别方式-Ansj中文分词 -
fncj:
你好,我们最近要搞一个人名识别功能,发现有两个问题:1、里有不 ...
介绍一种基于角色标注+字词体位法的人名识别方式-Ansj中文分词
文章列表
备份MySQL数据库的命令
mysqldump -hhostname -uusername -ppassword databasename > backupfile.sql
备份MySQL数据库为带删除表的格式
备份MySQL数据库为带删除表的格式,能够让该备份覆盖已有数据库而不需要手动删除原有数据库。
mysqldump -–add-drop-table -uusername -ppassword databasename > backupfile.sql
直接将MySQL数据库压缩备份
mysqldump -hhostname -uusername -ppassword d ...
公司有个项目让java从各种文档中抽取正文.
于是费了很多经历来写起初..去网上找demo
一下是摘抄一个哥们的例子
package org.css.resource.businesssoft.searchengine.quwenjiansuo;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import org.apache.poi.POITextExtractor;
import org.apache. ...
好了代码如下.我不废话了
package ansj.sun.os;
import ooo.connector.BootstrapSocketConnector;
import com.sun.star.beans.PropertyValue;
import com.sun.star.beans.XPropertySet;
import com.sun.star.container.XEnumeration;
import com.sun.star.container.XEnumerationAccess;
import com.sun.star.frame.XComponen ...
其实网上已经有不少关于.Openoffice使用的文章的.我这里只不过是画蛇添足多此一举.但是.因为长期不添足.现在说都不会话了.还是写点吧.希望对你有帮助.我最讨厌废话连篇了.所以不说废话了.还有我的表达能力有限.希望大家能凑合看.不要有不清楚的地方.可以留言讨论.也可以给我发邮件..(本人邮箱垃圾邮件堆满了,不一定能看到.)现在开始讲了.还有,没有用中文标点.这属于个人习惯吧.算了废话又来了开始讲了哦.
首先需要安装Openoffice主程序.
去Openoffice主站下载.
然后安装Openofficejdk.
从jdk的example文件夹中找到了学习步骤...就按照他的走吧
...
set JAVA_OPTS=-Xms512m -Xmx512m -XX:PermSize=32M -XX:MaxPermSize=64m
set PATH=d:\jni
放到catalina.bat下面
Trie树是搜索树的一种,它在本质上是一个确定的有限状态自动机,每个结点代表一个状态,根据输入变量的不同,进行状态转移。
为了减少Trie树结构的空间浪费,同时保证Trie[/size]树查询的效率,有研究者提出了 ...
最近总有人问我那个分词的问题.
其实是很早以前写的一个小程序了.当时写的的确是挺费劲的.
这个算法的文档我在以前博客里面发过.大家可以下载.
我认为双数组tire树.原理不是很复杂.只是在词典的构造中.去重要求很高.
最近几天...想试着把分词重新写一次.也不知道会写不了..
写的过程中的经验我会和大家分享.
今天晚上开工...
java的Runtime.getRuntime().exec(commandStr)可以调用执行cmd指令。
cmd /c dir 是执行完dir命令后关闭命令窗口。
cmd /k dir 是执行完dir命令后不关闭命令窗口。
cmd /c start dir 会打开一个新窗口后执行dir指令,原窗口会关闭。
cmd /k start dir 会 ...
前几天遇到了这个问题.修改了很久..网上有个方法.叫encoding_mod好像可以解决..
起初觉得问题特别高深....查了很多人的方法...基本都不管用..也许是没做对
最后我把
<Connector port="7009" protocol="AJP/1.3" redirectPort="8443"/>
加了一句URIEncoding="UTF-8"
<Connector port="7009" protocol="AJP/1.3" redirec ...
SOAP Action 必须包含头..所以呀重写ObjectServiceFactory
这样就能访问了..记得区分方法的大小写
public class CustomServiceFactory extends ObjectServiceFactory {
private static final String NAME_SPACE = "http://www.gb168.cn/webservices/";
@Override
protected String getAction(OperationInfo op) {
return new Strin ...
10000+个数字钟找出top100
import java.util.Arrays;
import java.util.Random;
public class Top100 {
private static Node head = null;
private static Node end = null;
private static Node tempNode = null;
private static Node node = null;
public static int[] getTop100(int[] inputArray) {
i ...
我早几日APACHE+TOMCAT整合好了并接绑定好了域名。。。兴致勃勃写好文档放群里面给共享了。。后来自己测试,域名访问成功了,但是某些页面的被包含页面没找到。如: <%@include file="/head.jsp" %>,我的head.jsp是在项目的根目录,包含页面lingban.jsp在webroot的一文件夹里, 但是我的首页也包含了head页面却没问题 <%@include file="head.jsp" %>,首页index页面也在根目录,一下是我的整合的过程,请如果的大哥大姐看看,小弟不胜感激了!
...
相信很多人会遇到,自己只有一台服务器,而想在一台服务器上,有若干个应用。让用户访问。同时又不想用URL转发之类,对用户不好的体验。
如果用IIS配置起来,就很简单了,但jsp系列的,在网上查找的资料都不完全符合自己实践。还是自己模式配置在apache、tomcat集群情况下,单IP多域名配置。
需求:
1、静态页面由apache响应,动态的jsp部分,由tomcat处理。
2、只有一台服务器,却需要有若干个jsp应用要运行,希望客户可以用域名访问
3、不用URL转发,对用户不好,并且不利于SEO
配置
1、apache+ ...
引用
好像描述的由点问题,再细化点吧!
1、找出 连续相同的字符个数最少为min的字符串
2、对字符串排序,这里的排序不是指按字母排序,而是按“连续相同的字符个数”排序
比如:str1="abcdbcebcgh" str2="eabcfbcxbcv" min=2
所得的结果希望是:
NO1. str1: start 0; end 2; str2: start 1; end 3
the same string: abc
NO2. str1: start 4; end 5; str2: start 5; end 6
...
两个类一个写入对象.一个读入对象
还需要一个词典,写几个词作测试
美人计
美人蕉
美人鱼
美容美发店
美容师
美容术
美容院
美声
美食
美食城
美食家
美事
美术
美术馆
美术家
美术界
美术年
美术片
美术品
美术师
美术室
美术纸
美术字
美谈
美味
美文
美协
美学
美学家
美意
import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStrea ...