`

Thanslation of Summary of Apache UIMA Capabilities

    博客分类:
  • UIMA
阅读更多

 

 

1.

模块 描述
UIMA Framework Core

集成了创建、部署、运行和管理UIMA组件核心功能的框架。这些组件包括已配置的和/或者分布式的配置里的分析引擎(AE)和集成处理引擎(Collection Processing Engine)

这个框架包括了传输层适配、CAS管理、工作流管理的核心组件的实现。这些组件是给予便于陈述的详细规格说明(declarative specifications),资源管理,配置管理,登陆和其他功能。

C++和其他变成互操作性

包括C++ CAS,也支持能用内建的JNI适配器部署在UIMA运行时的UIMA兼容的C++组件的创建。

包括创建基于服务的UIMA引擎的支持。这对包装用不同语言编写的现有代码是理想的。

2.

框架服务和API 注意这些组件的接口对于开发者是可得到的,但是在不同的UIMA框架的实现中可能有不用的实现。
CAS 这些类为开发者提供到CAS的类型化的(typed acess)入口,包括 类型系统模型(type system schema)、元素、分析的主题(subjects of anolysis : Sofas)和索引。多主题分析机制支持独立的或者并发的对同样的物品(artifact)(e.g. 文件)的多视角的分析,支持多语言(multi-lingual)和多形态(multi-modal)的分析。
JCas CAS的替代接口,为基于Java的分析组件提供本地java对象使用CAS类型和他们的属性和特征,使用JavaBeans getters和setters的习惯。
集成处理管理(Collection Processing Management : CPM) 为集成处理引擎(Collection Processing Engine)在已配置的和/或分布式配置里运行的核心功能。CPM提供穿过平行处理管道、检查点、性能监控和可恢复性的可测量性。
资源管理者(Resource Manager) 为UIMA组件提供运行时外部处理资源命名、共享和缓存能力。
配置管理者(Configration Manager) 为UIMA组件提供运行时配置参数的设置。
记录者(Logger) 提供通用日志记录工具。
工具和公共程序(Utilities)
JCasGen

为CAS类型从UIMA XML类型系统定义中生成Java对象模型的公共程序

保存和恢复CAS内容 在核心框架中支持用XMI格式保存和恢复CAS内容到流中的API

Eclispe 的 PEAR* 包装器

构建UIMA归档文件来便利出口(porting)、注册、安装和测试组件的工具
PEAR 安装器 在安装UIMA中安装和验证UIMA组件归档文件的工具
PEAR 合并器 联合多个PEAR成一个的公共程序
组件描述符编辑器 为UIMA分析引擎和其他UIMA组件类型(包括集成读者(Collection Reader)和CAS消费者(CAS Consumers))详细说明和配置组件描述符的Eclispe插件。
CPE 配置器 为配置集成处理引擎和把这些引擎应用到文档的集成中的图形化工具。
Java 标注查看器(Annotation Viewer) 为了浏览标注和相关的CAS数据的查看器
CAS可视化调试器

为开发者提供详细的CAS内容的可视化视图的JAVA GUI 程序。

文档分析器 应用分析引擎到一批(sets of)文档中,并在查看器中现实结果的Java GUI 程序
实例分析组件
数据库Writer 使用JDBC将选择的CAS类型写入到关系数据库的CAS Consumer。这个代码在cpe/PersonTitleDBWriterCasConsumer文件夹下。
标注(Annotators) 一些用于教学目的的简单标注。包括:Date/time, Room-number, Regular expression, Tokenizer, 和Meeting-finder标注。也有可以从opennlp.org获取的标注包装器(wrappers for annotators)。也有CAS Multipliers的示例。
流控制器(Flow Controllers) 一个基于白板概念的示例流控制器。它将CAS发送到任何一个还没有处理过它的标注,当那个标注的输入可在CAS上获得时.
XMI集合阅读器(XMI Collection Reader), CAS消费者(CAS Consumer) 读写XMI格式的CAS

文件系统集合阅读器(File System Collection Reader)

为了从文件系统中拖出文件并初始化CAS的简单的集合阅读器

3.

可以从www.alphaworks.ibm.com/tech/uima 获得的组件
语义搜索CAS索引器 使用语义搜索引擎索引器来建立从CAS流的索引的CAS消费者。需要语义搜索引擎(从同一个地方可以获得)

 

(1)PEAR

An archive file that packages up a UIMA component with its code, descriptor files and other resources required to install and run it in another environment.

 

分享到:
评论

相关推荐

    dkpro-core:基于Apache UIMA框架的自然语言处理(NLP)的软件组件集合

    《DKPro Core:Apache UIMA框架下的自然语言处理组件库》 DKPro Core,全称为Deutsche Konrad-Probe Labor für Sprachtechnologie Core,是一款基于Apache UIMA(Unstructured Information Management ...

    apache-solr-uima-3.4.0.jar

    jar包,亲测可用

    cleartk:Apache UIMA的机器学习组件

    介绍ClearTK提供了一个框架,用于在Java中开发统计自然语言处理(NLP)组件,并基于Apache UIMA构建。 它由科罗拉多大学博尔德分校的计算语言和教育研究中心(CLEAR)开发。 ClearTK是使用Maven构建的,我们建议您...

    textimager-uima:用于自然语言处理的软件组件,基于Apache UIMA框架和DKPro

    textimager-uima 基于Apache UIMA框架和DKPro的自然语言处理软件组件。引用Wahed Hemati,Tolga Uslu,Alexander Mehler:TextImager:一个用于NLP的基于UIMA的分布式系统。 COLING(Demos)2016:59-63

    apache-uima-fit

    Unstructured Information Management applications are software systems that analyze large volumes ...官网在http://uima.apache.org/。 网络环境不方便到官网下载的话可以下载本资源。 有兴趣的同学可以学习一下。

    yodaqa:建立在Apache UIMA框架之上的问答系统

    YodaQA代表“另一个深度回答管道”,该系统建立在Apache UIMA和DKpro UIMA绑定之上,并作为Brmson平台的一部分进行开发。 QA逻辑大部分是原创作品,但许多设计和组件均受DeepQA(IBM Watson)和最新论文的启发。 ...

    org.apache.uima.runtime_3.0.1.jar.pack.gz

    org.apache.uima.runtime_3.0.1.jar.pack.gz

    UIMA-Ext:Apache UIMA插件和实用程序的集合。其中一些插件与语言无关。 其他可能是俄语专用的

    CLLKazan的UIMA-Ext UIMA-Ext是在Apache UIMA平台上用于俄语处理的一组组件(主要)。 给出了有关如何使用PoS-tagger评估框架的详细说明(在[Gareev,R.,Ivanov,V.俄语的统计词性标签的比较评估中描述。2014。出现...

    apache-uima

    Unstructured Information Management applications are software systems that analyze large volumes ...官网在http://uima.apache.org/。 网络环境不方便到官网下载的话可以下载本资源。 有兴趣的同学可以学习一下。

    Apache Solr(Apress,2015)

    You’ll also see how to integrate Solr with important related technologies like OpenNLP, Apache Tika, and Apache UIMA, among others, to take your search capabilities to the next level. This book ...

    ( IBM推出UIMA

    【IBM推出UIMA】这个标题提到的是IBM引入了一项名为UIMA(Unstructured Information Management Architecture,非结构化信息管理架构)的技术。UIMA是IBM开发的一个开源框架,主要用于分析、理解和提取非结构化数据...

    基于java的开发源码-UIMA注解类 uimaFIT.zip

    3. **uimaFIT**:uimaFIT是Apache UIMA的一个轻量级库,它通过Java注解简化了UIMA组件的配置和实现。uimaFIT允许开发者通过简单的注解来声明分析引擎的组件和参数,减少了XML配置文件的需求,提高了开发效率。 4. *...

    nd4j-jblas-0.4-rc2.2.zip

    【描述】中的"uima-profiler.zip"提到了一个用于评估和管理Apache UIMA(Unstructured Information Management Architecture)分析引擎服务(AES)的工具。Apache UIMA是一个框架,用于处理非结构化信息,如文本、...

    apache-solr-uima-3.5.0.jar

    jar包,亲测可用

    apache-solr-uima-3.2.0.jar

    jar包,亲测可用

    apache-solr-uima-3.1.0.jar

    jar包,亲测可用

    UIMA自带资源的介绍

    标题中的“UIMA自带资源的介绍”指的是一种名为Unstructured Information Management Architecture(UIMA)的框架,它是由Apache软件基金会开发的,主要用于处理非结构化的信息,如文本、语音等。UIMA的设计目的是...

    java版直播间源码-uima-as_old:阿帕奇游泳池的镜子

    【标题解析】:“java版直播间源码-uima-as_old:阿帕奇游泳池的镜子”这个标题暗示我们这里涉及的是一个使用Java语言编写的直播平台的源代码,且与Apache UIMA-AS(Unified Information Model and Architecture - ...

    基于Java的实例源码-的UIMA注解类 uimaFIT.zip

    Java的UIMA(Unstructured Information Management Architecture)框架是Apache软件基金会开发的一个开源项目,主要用于处理非结构化的信息,如文本、语音等。UIMA提供了一种标准的方式来分析、标记和检索此类信息,...

Global site tag (gtag.js) - Google Analytics