`
coderplay
  • 浏览: 578079 次
  • 性别: Icon_minigender_1
  • 来自: 广州杭州
社区版块
存档分类
最新评论

行业词库收集程序已经开源

阅读更多
前些天国庆在家,没网上. 地址在 http://code.google.com/p/wordseeker/ 采用Apache协议,对商业友好.
分享到:
评论
3 楼 coderplay 2008-10-11  
CJKTokenizer是我开始写的一个类,后面做法做了一点改变,就没用到它了。我让它deprecated了。所以编译的时候会出现警告,这很正常。 你编译其它开源代码的时候,也经常会碰到的
2 楼 coderplay 2008-10-11  
我在linux下编译的,所以没有注意utf-8. sorry.
以后会附算法详解的paper,目前写了1/3左右
1 楼 monner 2008-10-11  
感谢无私奉献劳动果实!
可是编译都有点问题!
请指明编译环境

我JDK1.5
ant编译时候提示有误
在javac参数中增加 encoding="UTF-8"
后可以进一步编译
不过仍然提示CJKTokenizer.java 使用或覆盖了已过时的 API。

请开源项目发起者稍微提供点Readme文档
至少指明编译环境和注意事项,既然真正当作一个开源项目,就要规范 哈哈~

相关推荐

    java开源包6

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包9

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包8

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包10

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    工具查询开源中文分词系统 HTTPCWS 1.0.0 PHP演示程序-httpcws-php-demo.zip

    【标题】中的“工具查询开源中文分词系统 HTTPCWS 1.0.0 PHP演示程序”揭示了我们要讨论的核心内容:一个基于PHP的开源项目,名为HTTPCWS,用于中文分词。这个系统提供了对中文文本进行词汇切分的能力,是自然语言...

    java开源包1

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包2

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包3

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包5

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包11

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包7

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包4

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包101

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    自动构建中文词库dict_build.zip

    成词条件互信息左右熵位置成词概率ngram 频率运行方法下载或者gradle distTar打包程序解压dict_build-x.x.x.tar解压之后,进入bin. 运行:./dict_build 你的数据文件的绝对路径结束之后,在数据文件同目录有文件:words_...

    基于文本内容的垃圾邮件过滤程序

    在VC++6.0中,可能使用了诸如jieba这样的开源分词库,来将连续的汉字序列切分成具有独立意义的词语。分词后的词汇作为特征向量,用于贝叶斯算法的训练和预测。 **数据挖掘** 数据挖掘是垃圾邮件过滤程序中不可或缺...

    google pinyin

    8. **特色功能**:谷歌拼音输入法具有多种特色功能,如拼音纠错、云词库(实时获取网络热词)、自定义短语、手写输入支持等。这些功能极大地提高了输入效率和准确性。 9. **兼容性**:谷歌拼音输入法不仅支持简体...

    POSCMS开源内容管理系统

    PHP开源网站管理系统(PhpOpenSourceCMS,简称POSCMS)以开放、开源、灵活为产品理念,基于PHP+MYSQL+CI框架开发的开源Web内容管理系统,程序完美兼容PHP7,并在PHP7基础上做了性能优化,系统更加稳定,操作人性化、...

    Java资源包01

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    LangXplore-开源

    对于LangXplore,此文件可能会提供如何运行程序的详细步骤,包括如何启动LXW32.exe或LXW64.exe,以及如何创建和管理自定义词典。此外,它还可能包含如何参与项目的开发、报告问题或提出改进建议的方法。 **总结** ...

    android电子词典

    在移动互联网时代,Android平台因其开源、灵活的特性,成为了开发者们构建各种应用程序的首选。其中,Android电子词典作为一款实用的学习工具,深受用户喜爱。本篇将深入探讨Android电子词典的开发过程,涵盖从设计...

Global site tag (gtag.js) - Google Analytics