`
soul_fly
  • 浏览: 39505 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
社区版块
存档分类
最新评论

Yard中文分词系统

阅读更多

Yard中文分词系统基于改进的正向最大匹配算法和全切分算法,利用双字哈希进行词典组织解决了中文长词切分带来的分词效率低下问题。
本次发布的版本为0.1版能对中文词组进行完美的切分同时利用词组的词频和词性解决了歧义划分的问题,但是对人名、地名、组织名、英文、数字等还不能进行很好的切分,在下一个版本中将解决这些问题。中文词典应用了搜狗实验室提供的互联网词库。纯java编写。本软件为开源软件你可以进行任何修改以适应你的需求,如果你加入了新功能请发送一份副本给我,我们一同完善改进。
我的联系方式:zhouhaibox@foxmail.com
分词精度为多少?朋友们自己去测试吧不会让你失望的!!

 

  • yard.rar (1.4 MB)
  • 描述: Yard中文分词系统V0.1版
  • 下载次数: 171
3
0
分享到:
评论
6 楼 soul_fly 2009-06-18  
jay_kid 写道

可以补上源码研究下吗?对怎样实现比较感兴趣 ^_^

请到下面下载最新版Yard中文分词系统V0.2.0版
http://soul-fly.iteye.com/blog/411071
5 楼 jay_kid 2009-06-18  
可以补上源码研究下吗?对怎样实现比较感兴趣 ^_^
4 楼 quxiuer 2009-06-17  
我要源码 谢谢 邮箱:qu_xiu_na@126.com
3 楼 soul_fly 2009-06-16  
鹤惊昆仑 写道

下载文件包中没有源码,我不需要,但提醒一下,别的朋友可能需要源码。


目前的版本中代码经常都要进行大的修改,所以代码的实际参考价值不大。等后面1.0正式版发布的时候我会将所有的源代码、文档以及所有的参考文献(主要是论文)还有图像化的操作界面都奉献给大家,请大家密切关注吧。
2 楼 鹤惊昆仑 2009-06-16  
下载文件包中没有源码,我不需要,但提醒一下,别的朋友可能需要源码。
1 楼 鹤惊昆仑 2009-06-16  
谢谢!才知道搜狗实验室开放了这么多有价值的材料!

相关推荐

    Yard中文分词系统V0.1.1版

    Yard中文分词系统采用改进了的正向最大匹配算法,利用双字哈希进行词典组织解决了中文分词中最长词带来的分词效率低下问题。 本次发布的版本为0.1.1版能对中文词组进行完美的切分同时利用词组的词频和词性解决了...

    后院分词系统(yard)源代码下载

    后院分词系统(Yard)是一款专注于中文分词的开源软件,它的出现为开发者提供了高效、准确的分词解决方案。源代码完全采用Java语言编写,确保了良好的跨平台性和可扩展性。Java作为一种广泛使用的编程语言,拥有丰富...

    Ruby-Yard是一款Ruby文档工具

    Yard的另一个亮点是其模板系统。默认情况下,Yard会生成一套标准的HTML文档结构,但开发者可以根据需求自定义模板,以适应不同的展示风格或者集成到现有的网站框架中。这使得Yard能够生成符合团队或项目风格的文档,...

    yard, YARD是一个 ruby 文档工具 Y 代表"Yay"!.zip

    yard, YARD是一个 ruby 文档工具 Y 代表"Yay"! : ruby 文档工具 ! 概要YARD是 ruby 编程语言的文档生成工具。 用户可以生成一致的。可用的文档,可以很容易地导出到许多格式,也支持扩展自定义类级定义( 比如自定义...

    Ruby文档工具Yard.zip

    Yard,是一款 Ruby 文档工具。使用它,你可以在为你的 Ruby app 写文档时预览你的代码。它拥有简单的定制模板,支持你自己的 DSL,并有大量优秀的扩展,而且每天都在增加。 标签:Yard

    yard-mode.el:Emacs次要模式,用于编辑YARD标签

    支持在ruby注释中将YARD标签和指令字体化的基本支持。 安装 使用 : Mx package-install yard-mode 。 将其添加到您的Ruby挂钩: (add-hook 'ruby-mode-hook 'yard-mode ) 如果您还希望得到eldoc支持,以便在...

    Automatic sweep the yard_扫码_TheYard_

    "Automatic sweep the yard_扫码_TheYard_"这个标题可能指的是一个自动化系统,它能够在特定环境中,如仓库(The Yard)快速扫描并识别多个条形码或二维码,以实现高效的数据录入和管理。下面我们将深入探讨扫码技术...

    yard:另一个ROC曲线抽屉

    由于yard目前处于繁重的开发过程中,因此您可能无法获得yard所有最新和最强大的功能,但是您很可能会在这里找到即使在特殊情况下也不会崩溃的版本。 的页面。 在此页面上,您可以尽可能密切地关注yard的发展。 您...

    The YARD Parsing Framework for C++-开源

    《深入解析YARD C++解析框架》 YARD(Yet Another Recursive Descent)是一个专为C++设计的开源解析框架,其目标是提供一个高效、灵活且易于使用的工具,用于处理语言解析和编译任务。这个框架的核心在于递归下降...

    Yard_OpenGL-master.zip

    "Yard_OpenGL-master.zip"是一个包含OpenGL相关代码的压缩包,适合开发者进行二次开发,将其集成到自己的项目中以实现丰富的图形渲染功能。 首先,让我们了解一下OpenGL的基本概念。OpenGL是一个低级的图形库,它不...

    Indirect Addressing - Pallet Tracking Brick Yard 500.rar

    间接寻址是工业自动化编程中的一个重要概念,尤其在Allen Bradley(AB)的可编程逻辑控制器(PLC)系统中,它被广泛应用于数据处理和内存管理。本资料“Indirect Addressing - Pallet Tracking Brick Yard 500.rar”...

    engineyard:从命令行部署到Engine Yard Cloud

    Engine Yard命令行实用程序。 在Ruby 1.8.7或1.9.2上安装 注意:这对您的Engine Yard环境Ruby版本没有影响。 这仅与用于运行此gem的本地开发Ruby版本有关。 无论此更改如何,环境都可以继续使用所选的Ruby版本。 ...

    yard-contracts:来自合同的自动参数文档的 YARD 插件

    堆场合同 yard-contracts 是一个 YARD 插件,可与出色的 gem 配合使用,自动记录方法签名中的参数类型和描述,节省时间,使代码简洁并保持文档一致。 您是否厌倦了编码验证、编写错误消息然后记录这些事情? 所有...

    YARD是Ruby文档工具。 Y代表“是!”-Ruby开发

    Ruby文档工具摘要YARD是Ruby编程语言的文档生成工具。 它使用户能够生成一致且可用的文档,并可以将其导出到YARD:是的! Ruby文档工具摘要YARD是用于Ruby编程语言的文档生成工具。 它使用户能够生成一致,可用的...

    yard-link_stdlib

    待办事项:删除此内容和上面的文字,并描述您的宝石安装将此行添加到您的应用程序的Gemfile中: gem 'yard-link_stdlib' 然后执行: $ bundle或将其自己安装为: $ gem install yard-link_stdlib用法待办事项:在...

    yard-junk:摆脱YARD文档中的垃圾

    Yard-Junk:在您的YARD文档中摆脱垃圾! Yard-Junk是插件/补丁,它提供: 结构化文档错误记录; 文档错误验证器,可以集成到CI管道中。 展示柜 让我们为库生成文档。 不带垃圾场的`yard doc`输出[warn]: in YARD...

    Yard-开源

    Yard是一套Perl脚本,用于创建自定义引导/救援/ Linux软盘。 您可以指定一组基本的文件和实用程序来进行包含,而Yard可以处理详细信息,包括检查错误,遗漏和不一致之处。

    快递系统.zip

    "YM"标签可能代表某种特定的物流模式或者优化策略,如“ Yard Management”,即场地管理,这在大型物流中心中尤为重要,它涉及到车辆调度、货物装卸和存储空间的高效利用。 在快递系统的开发中,实时更新快递单信息...

    yard-sorbet:类型是文档

    Sorbet 是 Ruby 社区推出的一种静态类型系统,它可以帮助开发人员在编写代码时捕获类型错误,提高代码质量。 在了解 Yard-Sorbet 之前,我们先简单回顾一下 YARD 和 Sorbet: **YARD** YARD 是一个开源的 Ruby ...

    Bone Yard-开源

    通过开源这种方式,Bone Yard鼓励社区参与和改进,共同构建更强大的模板系统。 总结起来,Bone Yard 是一个高效的Emacs插件,专注于提升开发者的效率,通过模板插入功能简化文档和代码的初始化过程。其开源属性不仅...

Global site tag (gtag.js) - Google Analytics