`
soul_fly
  • 浏览: 39325 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
社区版块
存档分类
最新评论

Yard中文分词系统V0.2.0版发布附全部源代码

阅读更多

经过这几天加班加点的调试Yard中文分词系统V0.2.0版本终于出来了,这次Yard中文中文系统不但能够对中文进行很好的切分而且能够能对数字和英文进行识别切分了,应JavaEyer们的要求这次将源代码一起发布出来供大家一起学习。

下面谈谈中文智能分词技术在自然语言理解中的应用,智能分词技术是实现自然语言理解最初的一个环节,它将组成语句的核心词提炼出来供语义分析模块使用。在分词的过程中,如何能够恰当地提供足够的词来供分析程序处理,并且过滤掉冗余的信息,这是后期语义分析的质量和速度的重要前提。尤里卡的智能分词避免了传统分词技术在拆分时产生的歧义组合。从而为语义理解的处理提供了良好的原始材料。同时,在分词的过程中,知识库当中的同义词会被逐个匹配并同时提交给语义理解模块使用,这样处理过的句子,不仅提供了原始的句型,还同时搭载了语句的概念部分。

实现中文智能分词是Yard中文分词系统的终极目标,当然现在离这个目标还很遥远不过有大家的支持我会坚持不懈的努力,希望大家提出宝贵的意见和建议。

文件已经从QQ文件中转站转到JavaEye上。

 

 

 

  • Yard0.2.0.rar (1.3 MB)
  • 描述: 2010-11-11最新修改
  • 下载次数: 385
19
0
分享到:
评论
13 楼 yangfan57319 2012-07-18  
先参考参考吧。
12 楼 lvshuding 2011-07-14  
Alex2008 写道
楼主有没有文档行之类的东西,刚开始学习这方面的东西,感觉无从下手

11 楼 JonyUabka 2010-09-17  
闻风而来,前来学习。
10 楼 zjw_inrain 2010-03-15  
我想知道怎么建立自己的词典....
可否给点建议?
9 楼 soul_fly 2009-09-29  
Alex2008 写道
楼主有没有文档行之类的东西,刚开始学习这方面的东西,感觉无从下手

有 需要的话可与我联系。
8 楼 Alex2008 2009-09-20  
楼主有没有文档行之类的东西,刚开始学习这方面的东西,感觉无从下手
7 楼 bit6211 2009-09-09  
谢谢楼主
6 楼 ASTER1111 2009-07-24  
看了你的代码,确实很棒。
支持你继续完善下去
我也可以继续学习了
5 楼 linliangyi2007 2009-06-23  
给点DEMO来说明一下分词器的特性呀
4 楼 treblesoftware 2009-06-20  
谢谢!    
3 楼 soul_fly 2009-06-20  
alexcheng 写道

你的这个会做命名实体识别(NER)吗?想当年我本科毕业论文就是做的那个。。。

暂时还不行,不过1.0正式版中一定会有的。
2 楼 alexcheng 2009-06-20  
你的这个会做命名实体识别(NER)吗?想当年我本科毕业论文就是做的那个。。。
1 楼 rainv 2009-06-19  
有时间研究研究。

相关推荐

    Yard中文分词系统V0.1.1版

    Yard中文分词系统采用改进了的正向最大匹配算法,利用双字哈希进行词典组织解决了中文分词中最长词带来的分词效率低下问题。 本次发布的版本为0.1.1版能对中文词组进行完美的切分同时利用词组的词频和词性解决了...

    后院分词系统(yard)源代码下载

    后院分词系统(Yard)是一款专注于中文分词的开源软件,它的出现为开发者提供了高效、准确的分词解决方案。源代码完全采用Java语言编写,确保了良好的跨平台性和可扩展性。Java作为一种广泛使用的编程语言,拥有丰富...

    Ruby-Yard是一款Ruby文档工具

    通过查看这个文件,你可以深入了解Yard的实现细节,包括源代码、测试、示例等,这对于深入学习和贡献Yard项目非常有帮助。 总结来说,Ruby-Yard是一款不可或缺的Ruby开发工具,它通过自动化文档生成和强大的定制...

    Java编写的贪吃蛇源代码

    ### Java编写的贪吃蛇游戏源代码解析 #### 一、概述 本篇文章将深入解析一个用Java编写的经典贪吃蛇游戏的源代码。通过分析该程序的结构与实现细节,帮助读者理解如何利用Java语言及图形界面编程来开发简单的游戏...

    贪吃蛇源代码

    【贪吃蛇源代码】是一组编程学习资源,包含了实现贪吃蛇游戏的关键组件。这个压缩包中的四个文件——`Snack.java`, `Yard.java`, `age.java`, 和 `Dir.java`,分别对应游戏的不同部分,让我们逐一解析它们所包含的...

    yard, YARD是一个 ruby 文档工具 Y 代表"Yay"!.zip

    yard, YARD是一个 ruby 文档工具 Y 代表"Yay"! : ruby 文档工具 ! 概要YARD是 ruby 编程语言的文档生成工具。 用户可以生成一致的。可用的文档,可以很容易地导出到许多格式,也支持扩展自定义类级定义( 比如自定义...

    Ruby文档工具Yard.zip

    Yard,是一款 Ruby 文档工具。使用它,你可以在为你的 Ruby app 写文档时预览你的代码。它拥有简单的定制模板,支持你自己的 DSL,并有大量优秀的扩展,而且每天都在增加。 标签:Yard

    表达式计算器源代码 java实现

    ### 表达式计算器源代码 Java实现 #### 1. 项目概述 这是一个基于Java Swing的图形界面计算器应用程序。用户可以在界面上输入包含括号和基本运算符(加、减、乘、除)的数学表达式,并通过点击“Enter”按钮来获取...

    Yard_OpenGL-master.zip

    OpenGL,全称Open Graphics Library,是一种开放源代码的跨语言、跨平台的应用程序编程接口(API),主要用于渲染2D、3D矢量图形。它在计算机图形学领域有着广泛的应用,尤其是在游戏开发、科学可视化、虚拟现实等...

    The YARD Parsing Framework for C++-开源

    这个框架的核心在于递归下降解析技术,这是一种广泛应用于编译器和解释器构造的技术,通过构建语法分析树来理解源代码结构。 YARD C++解析框架的源代码现托管在Google Code上,项目地址为...

    复杂表达式的计算——数据结构课程设计(文档+源代码)

    源代码通常包括了表达式转换、解析和计算的模块。 在课程设计中,你可能会被要求完成以下任务: - 设计并实现表达式树的数据结构。 - 编写算法将中缀表达式转换为后缀表达式。 - 实现一个计算器程序,能接收后缀...

    MATLAB课程课件及代码_yard5oo_Matlab2018课件_matlab_金融_

    本资料包“MATLAB课程课件及代码_yard5oo_Matlab2018课件_matlab_金融_”是专为学习金融应用的MATLAB用户设计的。包含的MATLAB2018课件不仅提供了基础的MATLAB语言教程,还深入探讨了金融领域的特定应用。这是一份...

    贪食蛇源代码(java实现)及java文件

    在这个压缩包中,包含了四个Java源文件(Yard.java、Snake.java、Egg.java、Dir.java)以及一个编译后的jar可执行文件(Snake.jar)。让我们一一探讨这些文件所涉及的Java编程知识点。 1. **类与对象**:在Java中,...

    yard:另一个ROC曲线抽屉

    由于yard目前处于繁重的开发过程中,因此您可能无法获得yard所有最新和最强大的功能,但是您很可能会在这里找到即使在特殊情况下也不会崩溃的版本。 的页面。 在此页面上,您可以尽可能密切地关注yard的发展。 您...

    yard-mode.el:Emacs次要模式,用于编辑YARD标签

    支持在ruby注释中将YARD标签和指令字体化的基本支持。 安装 使用 : Mx package-install yard-mode 。 将其添加到您的Ruby挂钩: (add-hook 'ruby-mode-hook 'yard-mode ) 如果您还希望得到eldoc支持,以便在...

    yard-contracts:来自合同的自动参数文档的 YARD 插件

    堆场合同 yard-contracts 是一个 YARD 插件,可与出色的 gem 配合使用,自动记录方法签名中的参数类型和描述,节省时间,使代码简洁并保持文档一致。 您是否厌倦了编码验证、编写错误消息然后记录这些事情? 所有...

    yard-sorbet:类型是文档

    Sorbet 是 Ruby 社区推出的一种静态类型系统,它可以帮助开发人员在编写代码时捕获类型错误,提高代码质量。 在了解 Yard-Sorbet 之前,我们先简单回顾一下 YARD 和 Sorbet: **YARD** YARD 是一个开源的 Ruby ...

    Automatic sweep the yard_扫码_TheYard_

    "Automatic sweep the yard_扫码_TheYard_"这个标题可能指的是一个自动化系统,它能够在特定环境中,如仓库(The Yard)快速扫描并识别多个条形码或二维码,以实现高效的数据录入和管理。下面我们将深入探讨扫码技术...

    reflexive:Reflexive是一个基于Web的实时课程和源代码浏览器-Web live source code

    对于RDoc或YARD等静态代码分析工具而言,这是不可能或非常困难的。 Reflexive是Sinatra应用程序,可以独立使用,也可以从Rails应用程序安装为Rack应用程序。 Reflexive基于标准的1.9.2 Ruby库,该库使用Method/...

    Rust中 Shutting-yard算法的示例实现_rust_代码_下载

    在 Rust中 Edsger Dijkstra 的Shutting-yard 算法的示例实现。 此实现处理: 二进制+, -, *, /, 和^(指数)运算符 一元+和-运算符 括号 关联性(大多数运算符左侧,取幂右侧) 分流 Rust 包括一个基于正则表达式...

Global site tag (gtag.js) - Google Analytics