`
soul_fly
  • 浏览: 39321 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
社区版块
存档分类
最新评论

Yard中文分词系统V0.1.1版发布啦

阅读更多

这次主要是对Yard中文分词系统里面关于最长词的归并算法做了优化,现在系统能够对“使用户满意的做法,乒乓球拍卖完了”这样的句型进行正确切分了。但是目前一直没有找到合适的字频词频词典,所以最大概率分词算法还没能加入到分词系统中。按计划打算在这周自己对1亿字左右的语料进行切分统计做个字频词频词典出来到时候分享给大家。
就在昨天我认识的一个学中文信息处理的兄弟,由于答辩的时候被一老教授给K了心情很不爽说什么想放弃了不想再从事这个行业。我不知道他是真的不想再从事这个行业还是因为老教授的原因,我只知道我自己很喜欢这个行业我对文字着迷对每次取得的进步都感到很欣喜哪怕是很小的进步!

欢迎大家下载并提出宝贵意见!

Yard中文分词系统V0.1.1版下载


Yard中文分词系统V0.1.1版

 

  • Yard0.1.1.rar (1.2 MB)
  • 描述: Yard中文分词系统V0.1.1版
  • 下载次数: 129
3
0
分享到:
评论
3 楼 yefeng 2009-06-18  
有没有使用了,特别的算法
2 楼 soul_fly 2009-06-17  
zygege 写道

我以为是真的分析,原来是词库

没有词库程序是不能正常运行的。
1 楼 zygege 2009-06-17  
我以为是真的分析,原来是词库

相关推荐

    Yard中文分词系统V0.1.1版

    Yard中文分词系统采用改进了的正向最大匹配算法,利用双字哈希进行词典组织解决了中文分词中最长词带来的分词效率低下问题。 本次发布的版本为0.1.1版能对中文词组进行完美的切分同时利用词组的词频和词性解决了...

    后院分词系统(yard)源代码下载

    后院分词系统(Yard)是一款专注于中文分词的开源软件,它的出现为开发者提供了高效、准确的分词解决方案。源代码完全采用Java语言编写,确保了良好的跨平台性和可扩展性。Java作为一种广泛使用的编程语言,拥有丰富...

    Ruby-Yard是一款Ruby文档工具

    Yard的另一个亮点是其模板系统。默认情况下,Yard会生成一套标准的HTML文档结构,但开发者可以根据需求自定义模板,以适应不同的展示风格或者集成到现有的网站框架中。这使得Yard能够生成符合团队或项目风格的文档,...

    yard, YARD是一个 ruby 文档工具 Y 代表"Yay"!.zip

    yard, YARD是一个 ruby 文档工具 Y 代表"Yay"! : ruby 文档工具 ! 概要YARD是 ruby 编程语言的文档生成工具。 用户可以生成一致的。可用的文档,可以很容易地导出到许多格式,也支持扩展自定义类级定义( 比如自定义...

    Ruby文档工具Yard.zip

    Yard,是一款 Ruby 文档工具。使用它,你可以在为你的 Ruby app 写文档时预览你的代码。它拥有简单的定制模板,支持你自己的 DSL,并有大量优秀的扩展,而且每天都在增加。 标签:Yard

    yard:另一个ROC曲线抽屉

    由于yard目前处于繁重的开发过程中,因此您可能无法获得yard所有最新和最强大的功能,但是您很可能会在这里找到即使在特殊情况下也不会崩溃的版本。 的页面。 在此页面上,您可以尽可能密切地关注yard的发展。 您...

    yard-mode.el:Emacs次要模式,用于编辑YARD标签

    支持在ruby注释中将YARD标签和指令字体化的基本支持。 安装 使用 : Mx package-install yard-mode 。 将其添加到您的Ruby挂钩: (add-hook 'ruby-mode-hook 'yard-mode ) 如果您还希望得到eldoc支持,以便在...

    Automatic sweep the yard_扫码_TheYard_

    "Automatic sweep the yard_扫码_TheYard_"这个标题可能指的是一个自动化系统,它能够在特定环境中,如仓库(The Yard)快速扫描并识别多个条形码或二维码,以实现高效的数据录入和管理。下面我们将深入探讨扫码技术...

    engineyard:从命令行部署到Engine Yard Cloud

    Engine Yard命令行实用程序。 在Ruby 1.8.7或1.9.2上安装 注意:这对您的Engine Yard环境Ruby版本没有影响。 这仅与用于运行此gem的本地开发Ruby版本有关。 无论此更改如何,环境都可以继续使用所选的Ruby版本。 ...

    The YARD Parsing Framework for C++-开源

    《深入解析YARD C++解析框架》 YARD(Yet Another Recursive Descent)是一个专为C++设计的开源解析框架,其目标是提供一个高效、灵活且易于使用的工具,用于处理语言解析和编译任务。这个框架的核心在于递归下降...

    Yard_OpenGL-master.zip

    "Yard_OpenGL-master.zip"是一个包含OpenGL相关代码的压缩包,适合开发者进行二次开发,将其集成到自己的项目中以实现丰富的图形渲染功能。 首先,让我们了解一下OpenGL的基本概念。OpenGL是一个低级的图形库,它不...

    Indirect Addressing - Pallet Tracking Brick Yard 500.rar

    间接寻址是工业自动化编程中的一个重要概念,尤其在Allen Bradley(AB)的可编程逻辑控制器(PLC)系统中,它被广泛应用于数据处理和内存管理。本资料“Indirect Addressing - Pallet Tracking Brick Yard 500.rar”...

    yard-contracts:来自合同的自动参数文档的 YARD 插件

    堆场合同 yard-contracts 是一个 YARD 插件,可与出色的 gem 配合使用,自动记录方法签名中的参数类型和描述,节省时间,使代码简洁并保持文档一致。 您是否厌倦了编码验证、编写错误消息然后记录这些事情? 所有...

    YARD是Ruby文档工具。 Y代表“是!”-Ruby开发

    Ruby文档工具摘要YARD是Ruby编程语言的文档生成工具。 它使用户能够生成一致且可用的文档,并可以将其导出到YARD:是的! Ruby文档工具摘要YARD是用于Ruby编程语言的文档生成工具。 它使用户能够生成一致,可用的...

    yard-link_stdlib

    待办事项:删除此内容和上面的文字,并描述您的宝石安装将此行添加到您的应用程序的Gemfile中: gem 'yard-link_stdlib' 然后执行: $ bundle或将其自己安装为: $ gem install yard-link_stdlib用法待办事项:在...

    yard-junk:摆脱YARD文档中的垃圾

    Yard-Junk:在您的YARD文档中摆脱垃圾! Yard-Junk是插件/补丁,它提供: 结构化文档错误记录; 文档错误验证器,可以集成到CI管道中。 展示柜 让我们为库生成文档。 不带垃圾场的`yard doc`输出[warn]: in YARD...

    Bone Yard-开源

    5. **版本控制**:作为开源软件, Bone Yard 遵循版本控制,发布的boneyard-0.9.0是该项目的一个稳定版本,用户可以信赖其稳定性和兼容性。 在实际应用中,开发人员可以将 Bone Yard 集成到自己的Emacs配置中,通过...

    webpack-yard:了解Webpack技能

    执行命令npm run dev 浏览器输入地址查看控制台发布模式 执行命令npm run build 和 npm run koa 浏览器输入地址查看控制台项目环境(准备工作)os windows10vscode 1.55.0node v12.18.4webpack v5.30.0emsdk v2.0.16...

    Yard-开源

    Yard是一套Perl脚本,用于创建自定义引导/救援/ Linux软盘。 您可以指定一组基本的文件和实用程序来进行包含,而Yard可以处理详细信息,包括检查错误,遗漏和不一致之处。

    快递系统.zip

    《构建高效快递物流系统的关键技术与流程》 在数字化时代,快递系统已成为现代生活不可或缺的一部分。"快递系统.zip"这个压缩包文件所涵盖的内容,显然与物流系统的开发、运营及管理紧密相关,尤其是涉及到站点收...

Global site tag (gtag.js) - Google Analytics