`
lxneng
  • 浏览: 190129 次
  • 性别: Icon_minigender_1
  • 来自: 火星
社区版块
存档分类
最新评论

安装试用基于HTTP协议的开源中文分词系统“HTTPCWS”

阅读更多
官方程序地址

安装在ubuntu9.10上:
cd /usr/local
sudo wget http://httpcws.googlecode.com/files/httpcws-1.0.0-i386-bin.tar.gz
sudo su
tar zxvf httpcws-1.0.0-i386-bin.tar.gz
cd httpcws-1.0.0-i386-bin
ulimit -SHn 65535
/usr/local/httpcws-1.0.0-i386-bin/httpcws -d -x /usr/local/httpcws-1.0.0-i386-bin/dict/ -p 2009


测试效果:
#!/usr/bin/env python
# encoding: utf-8

import urllib

def main():
	title = u'基于HTTP协议的开源中文分词系统'.encode('gbk','replace')
	data = urllib.urlencode({'w':title})
	url = 'http://192.168.15.50:2009/?%s'%data
	body = urllib.urlopen(url)
	print body.read().decode('gbk','replace')
if __name__ == '__main__':
	main()


输出结果:基于 HTTP 协议 的 开源 中文 分词 系统
分享到:
评论

相关推荐

    工具查询开源中文分词系统 HTTPCWS 1.0.0 PHP演示程序-httpcws-php-demo.zip

    【标题】中的“工具查询开源中文分词系统 HTTPCWS 1.0.0 PHP演示程序”揭示了我们要讨论的核心内容:一个基于PHP的开源项目,名为HTTPCWS,用于中文分词。这个系统提供了对中文文本进行词汇切分的能力,是自然语言...

    基于HTTP协议的开源中文分词系统,php演示

    【标题】: "基于HTTP协议的开源中文分词系统,php演示" 涉及的知识点 在IT领域,中文分词是自然语言处理(NLP)中的关键步骤,尤其对于中文文本的理解和分析至关重要。这里提到的是一个开源项目,它提供了一个基于...

    工具查询开源中文分词系统 HTTPCWS 1.0.0 PHP演示程序-httpcws-php-demo.rar

    【项目资源】:包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、...

    [工具查询]开源中文分词系统 HTTPCWS 1.0.0 PHP演示程序_httpcws-php-demo.rar

    【项目资源】:包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、...

    (源码)基于C语言的Friso中文分词系统.zip

    Friso是一个使用C语言开发的开源中文分词器,它基于mmseg算法实现,支持多种分词模式,并具有良好的性能和扩展性。Friso中文分词系统不仅适用于中文分词,还支持英文分词和混合语言分词,具有广泛的应用场景。 ## ...

    基于Java的开源内容管理系统.zip

    基于Java的开源内容管理系统.zip基于Java的开源内容管理系统.zip基于Java的开源内容管理系统.zip基于Java的开源内容管理系统.zip基于Java的开源内容管理系统.zip基于Java的开源内容管理系统.zip基于Java的开源内容...

    基于PHP的HTTPCWS PHP中文分词扩展.zip

    【标题】"基于PHP的HTTPCWS PHP中文分词扩展.zip"揭示了这个压缩包包含一个PHP的扩展,专门用于处理中文分词。这个扩展可能是为了帮助PHP开发者更有效地进行中文文本处理,尤其是在搜索引擎优化、自然语言处理或者...

    开源免费的简易中文分词系统PHP分词的上乘之选

    标题中的“开源免费的简易中文分词系统PHP分词的上乘之选”指的是一个针对中文文本处理的软件工具,特别适用于PHP编程语言。在IT领域,中文分词是自然语言处理(NLP)的一个重要步骤,它涉及到将连续的汉字序列切...

    基于HMM模型中文分词系统

    “基于HMM模型中文分词系统”是指使用隐马尔科夫模型(Hidden Markov Model,简称HMM)来实现对中文文本的分词处理。中文分词是自然语言处理中的基础步骤,它将连续的汉字序列分割成具有语义的词汇单元,以便后续的...

    基于Java开源内容管理系统项目源码.zip

    基于Java开源内容管理系统项目源码.zip基于Java开源内容管理系统项目源码.zip基于Java开源内容管理系统项目源码.zip基于Java开源内容管理系统项目源码.zip基于Java开源内容管理系统项目源码.zip基于Java开源内容管理...

    基于Java开发的开源内容管理系统源码.zip

    基于Java开发的开源内容管理系统源码.zip基于Java开发的开源内容管理系统源码.zip基于Java开发的开源内容管理系统源码.zip基于Java开发的开源内容管理系统源码.zip基于Java开发的开源内容管理系统源码.zip基于Java...

    基于PHP的SCWS开源免费的简易php中文分词系统源码.zip

    SCWS(Simple Chinese Word Segmentation)是一个开源且免费的简易PHP中文分词系统,由华大的黄海广先生开发。这个系统主要针对简体中文文本进行分词处理,旨在为PHP开发者提供一种轻量级、高效的中文处理工具,使得...

    基于PHP的SCWS 开源免费的简易php中文分词系统.zip

    SCWS(Simple Chinese Word Segmentation)是一个开源且免费的简易PHP中文分词系统,由华大的Xunsearch团队开发。这个系统旨在为PHP开发者提供一个轻量级、高效的中文分词解决方案,使得在PHP环境中处理中文文本变得...

    ONVIF2.0中文协议+开源库onvif.rar

    总之,"ONVIF2.0中文协议+开源库onvif.rar"是一个极好的学习和开发资源,对于理解ONVIF协议、开发基于该协议的网络视频监控系统或应用具有重要作用。通过深入研究协议文档和实践使用开源库,可以掌握如何利用ONVIF...

    毕业设计:基于PHP简易中文分词系统.zip

    【标题】"毕业设计:基于PHP简易中文分词系统.zip" 涉及的主要知识点是构建一个使用PHP语言实现的简单中文分词系统。在这一领域,你需要掌握以下几个关键概念和技术: 1. **PHP**: PHP(Hypertext Preprocessor)是...

    基于Java的开源免费舆情监测网络监控系统设计源码

    本资源提供了一套基于Java语言编写的开源免费舆情监测网络监控系统设计源码。该项目包含了3436个JavaScript文件、352个PNG图像文件、274个CSS样式文件、272个SVG图形文件、235个Java源文件、129个HTML文件、61个JPG...

    ictclas4j开源分词系统

    java开源分词系统主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级7次,目前已经升级到了ICTCLAS2009 用户词典接口扩展用户可以动态增加、删除用户词典...

Global site tag (gtag.js) - Google Analytics