官方程序地址
安装在ubuntu9.10上:
cd /usr/local
sudo wget http://httpcws.googlecode.com/files/httpcws-1.0.0-i386-bin.tar.gz
sudo su
tar zxvf httpcws-1.0.0-i386-bin.tar.gz
cd httpcws-1.0.0-i386-bin
ulimit -SHn 65535
/usr/local/httpcws-1.0.0-i386-bin/httpcws -d -x /usr/local/httpcws-1.0.0-i386-bin/dict/ -p 2009
测试效果:
#!/usr/bin/env python
# encoding: utf-8
import urllib
def main():
title = u'基于HTTP协议的开源中文分词系统'.encode('gbk','replace')
data = urllib.urlencode({'w':title})
url = 'http://192.168.15.50:2009/?%s'%data
body = urllib.urlopen(url)
print body.read().decode('gbk','replace')
if __name__ == '__main__':
main()
输出结果:基于 HTTP 协议 的 开源 中文 分词 系统
分享到:
相关推荐
【标题】中的“工具查询开源中文分词系统 HTTPCWS 1.0.0 PHP演示程序”揭示了我们要讨论的核心内容:一个基于PHP的开源项目,名为HTTPCWS,用于中文分词。这个系统提供了对中文文本进行词汇切分的能力,是自然语言...
【标题】: "基于HTTP协议的开源中文分词系统,php演示" 涉及的知识点 在IT领域,中文分词是自然语言处理(NLP)中的关键步骤,尤其对于中文文本的理解和分析至关重要。这里提到的是一个开源项目,它提供了一个基于...
【项目资源】:包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、...
【项目资源】:包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、...
Friso是一个使用C语言开发的开源中文分词器,它基于mmseg算法实现,支持多种分词模式,并具有良好的性能和扩展性。Friso中文分词系统不仅适用于中文分词,还支持英文分词和混合语言分词,具有广泛的应用场景。 ## ...
基于Java的开源内容管理系统.zip基于Java的开源内容管理系统.zip基于Java的开源内容管理系统.zip基于Java的开源内容管理系统.zip基于Java的开源内容管理系统.zip基于Java的开源内容管理系统.zip基于Java的开源内容...
【标题】"基于PHP的HTTPCWS PHP中文分词扩展.zip"揭示了这个压缩包包含一个PHP的扩展,专门用于处理中文分词。这个扩展可能是为了帮助PHP开发者更有效地进行中文文本处理,尤其是在搜索引擎优化、自然语言处理或者...
标题中的“开源免费的简易中文分词系统PHP分词的上乘之选”指的是一个针对中文文本处理的软件工具,特别适用于PHP编程语言。在IT领域,中文分词是自然语言处理(NLP)的一个重要步骤,它涉及到将连续的汉字序列切...
“基于HMM模型中文分词系统”是指使用隐马尔科夫模型(Hidden Markov Model,简称HMM)来实现对中文文本的分词处理。中文分词是自然语言处理中的基础步骤,它将连续的汉字序列分割成具有语义的词汇单元,以便后续的...
基于Java开源内容管理系统项目源码.zip基于Java开源内容管理系统项目源码.zip基于Java开源内容管理系统项目源码.zip基于Java开源内容管理系统项目源码.zip基于Java开源内容管理系统项目源码.zip基于Java开源内容管理...
基于Java开发的开源内容管理系统源码.zip基于Java开发的开源内容管理系统源码.zip基于Java开发的开源内容管理系统源码.zip基于Java开发的开源内容管理系统源码.zip基于Java开发的开源内容管理系统源码.zip基于Java...
SCWS(Simple Chinese Word Segmentation)是一个开源且免费的简易PHP中文分词系统,由华大的黄海广先生开发。这个系统主要针对简体中文文本进行分词处理,旨在为PHP开发者提供一种轻量级、高效的中文处理工具,使得...
SCWS(Simple Chinese Word Segmentation)是一个开源且免费的简易PHP中文分词系统,由华大的Xunsearch团队开发。这个系统旨在为PHP开发者提供一个轻量级、高效的中文分词解决方案,使得在PHP环境中处理中文文本变得...
总之,"ONVIF2.0中文协议+开源库onvif.rar"是一个极好的学习和开发资源,对于理解ONVIF协议、开发基于该协议的网络视频监控系统或应用具有重要作用。通过深入研究协议文档和实践使用开源库,可以掌握如何利用ONVIF...
【标题】"毕业设计:基于PHP简易中文分词系统.zip" 涉及的主要知识点是构建一个使用PHP语言实现的简单中文分词系统。在这一领域,你需要掌握以下几个关键概念和技术: 1. **PHP**: PHP(Hypertext Preprocessor)是...
本资源提供了一套基于Java语言编写的开源免费舆情监测网络监控系统设计源码。该项目包含了3436个JavaScript文件、352个PNG图像文件、274个CSS样式文件、272个SVG图形文件、235个Java源文件、129个HTML文件、61个JPG...
java开源分词系统主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级7次,目前已经升级到了ICTCLAS2009 用户词典接口扩展用户可以动态增加、删除用户词典...