- 浏览: 19812 次
- 性别:
- 来自: 南京
最新评论
-
blackproof:
我现在被这个分析出来的东西搞疯了想把它跟数据库列对应最终没有任 ...
对于ictclas我真是无力吐槽了 -
blackproof:
建议还是用JNI调用dll的吧
对于ictclas我真是无力吐槽了
文章列表
好久没来写日志了,转眼已经毕业工作了大半年。
说起这份工作,不是自己向往的网络方向,而是ERP。而且使用的语言也不是市面上那些比较常见的,工作的大部分内容也是改bug。。。看别人的那些code确实是比较枯燥的,系统也是比较庞大的,所以刚开始来说,找出一个bug还是非常困难的。
工作很多时候都要为客户升级,所我经常只是copy代码,但是升级总是面临着系统的一些变化,单纯的copy总是不行的,总是要一边copy 一边测试。
不知道是自己还不适应的原因还是自己不认真,工作总是发生很多错误,以至于终于导致了领导找我谈话。。。
怎么说呢,自己还是太浮躁了,没有好 ...
关于定制Heritrix1.14爬取
- 博客分类:
- 研究记录
在网上参考了不少文章说可以继承FrontierScheduler,定制自己的爬取规则。我自己试了一下好像是不行的。
如下是我自己写了一个正则式,爬取门户网站中教育新闻。
import org.archive.crawler.datamodel.CandidateURI;
import org.archive.crawler.postprocessor.FrontierScheduler;
public class FrontierSchedulerForEduNews extends FrontierScheduler {
/**
*
*/
priva ...
如果这个月可以把聚类部分做好的话,希望在暑假期间公开自己的源代码和收集的数据。虽然自己的方法比较古老,代码也比较幼稚,效率不高,但是希望给后来人作为借鉴。
<?xml version="1.0" encoding="utf-8" ?>
<!-- 声明当前文件为xml文档【必】
-->
<rss version="2.0">
<!-- 声明当前文件内容为rss格式文件,属性version(必须)指定当前rss版本【必】
-->
<channel>
<!-- 固有节点【必】
-->
<title>新闻中心-国内焦点新闻</title>
<!- ...
实现wvtool中文功能要implement WVTTokenizer, TokenEnumeration接口
写道
package ICTCLAS.vsm;
import java.io.Reader;
import java.util.ArrayList;
import java.util.List;
import ICTCLAS.util.ICTCLASUtil;
import edu.udo.cs.wvtool.generic.tokenizer.WVTTokenizer;
import edu.udo.cs.wvtool.main.WVTDo ...
虽然它给我们带来了很多便利,但是你老是改来改去也太坑爹了吧?!啊?!
2011版本的出来没多久就有修改版,其实这也就算了,修改bug也是为我们用户负责。
可是你为什么这一年里出来3个版本差别怎么就那么大呢?!
我做java开发的,如果你是在不愿意搞个java版本就算了吧。
何必弄出来折腾人呢。
其实这我也能忍受,但是你能不能把文档写清楚点?!
不要用那些不土不洋的英文好了吗?
如果非要用我没有意见啊,不要一会洋文一会中文行吗!!!
那么短的函数方法还有错误。。。
无力吐槽。。。
在Eclipse中使用debug调试程序
- 博客分类:
- 研究记录
在Eclipse中使用debug调试程序最基本的操作是:
1.首先在一个java文件中设断点,然后debug as-->open debug Dialog,然后在对话框中选类后--> Run
当程序走到断点处就会转到debug视图下。
2.F5键与F6键均为单步调试,F5是step into,也就是进入本行代码中执行,F6是step over,
也就是执行本行代码,跳到下一行,
3.F7是跳出函数
4.F8是执行到最后。
1.Step Into (also F5) 跳入
2.Step Over (also F6) 跳过 ...
1,从Intalled JREs里修改;window->Preferences->Java->Installed JREs,选择当前的JRE,然后edit它;在新窗口里设置Default VM Arguments为 -Xms128M -Xmx512M即可;这个设置应该对所有的工程都有效;
2,如果仅仅是想对某个工程的有效的话,从Debug... 或Run...里修改,在(x)=Arguments里设置和上面相同的参数即可;
3,如果小猫猫Tomcat的话,window->Preferences->Application Server ...
ICTCLAS50添加注释
- 博客分类:
- 研究记录
package ICTCLAS.I3S.AC;
public class ICTCLAS50 {
/***********************************************************************
* 各个接口中,字符编码参数的需按照如下设置,接口参数中不再详细说明, 若编码不确定,系统将会自动识别编码
* (0 ...
读取文件夹和文件夹中的子文件夹
- 博客分类:
- 研究记录
写道
import java.io.File;import java.io.FileNotFoundException;import java.io.IOException;public class ReadFile { public static boolean readfile(String filepath) throws FileNotFoundException, IOException { try { File file = new File(filepath); if (!file.isDirectory()) { System.out.prin ...
要将 java.util.Date 转换为 java.sql.Date,下面就是示例代码
java.util.Date utilDate = new java.util.Date();
java.sql.Date sqlDate = new java.sql.Date(utilDate.getTime());
将String转换为java.util.Date:
Date date = new SimpleDateFormat("yy-MM-dd").parse(dateString);