中文庖丁分词的ANT文件 - ZFLLLZ - ITeye博客

`

qinglangee

浏览: 536488 次
性别:
来自: 青岛

最近访客更多访客>>

fywlts

zishan

chentging

sjjnzh123

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

直觉： gua 顶
com.opensymphony.xwork2.inject.DependencyException
fordfelix：加了以后任然存在这个异常求解！！
struts2 json 插件 @JSON(serialize = false)
fangyan_oracle：谢谢了，很受用
用IE修改当前页面内容的代码zzzz
cfying： [flash=200,200][/flash][url][/u ...
精解window.setTimeout()使用方式与参数传递问题！(转)
qinglangee： tiewazi 写道param必须是全局变量(即window对 ...
精解window.setTimeout()使用方式与参数传递问题！(转)

中文庖丁分词的ANT文件

博客分类：

ANT

阅读更多

ANT文件示例

中文庖丁分词的ANT文件

<?xml version="1.0"?>

<project name="paoding analysis" basedir="." default="build">

	<property file="build.properties" />
	<property environment="env" />

	<property name="src" value="src" />
	<property name="examples" value="examples" />
	<property name="classes" value="classes" />

	<path id="classpath">
		<fileset dir="lib">
			<include name="**/*.jar" />
		</fileset>
	</path>

	<tstamp>
		<format property="buildtime" pattern="yyyy-MM-dd HH:mm:ss" />
	</tstamp>

	<target name="help">
		<echo message="" />
		<echo message="中文分词 庖丁解牛 构建文件" />
		<echo message="------------------------------------------------------" />
		<echo message="compile" />
		<echo message="jar" />
		<echo message="build=compile+jar" />
	</target>

	<target name="compile" description="编译所有java文件到classes目录中">
		<delete dir="${classes}" />
		<mkdir dir="${classes}" />
		<javac destdir="${classes}" 
			encoding="UTF-8" 
			source="1.2" 
			target="1.1" 
			debug="true" 
			deprecation="false" 
			optimize="false" 
			nowarn="true" 
			failonerror="true">
			<src path="${src}" />
			<src path="${examples}" />
			<classpath refid="classpath" />
		</javac>
		<copy todir="${classes}" flatten="false" preservelastmodified="true">
			<fileset dir="${src}">
				<exclude name="**/*.java"/>
			</fileset>
			<fileset dir="${examples}">
				<exclude name="**/*.java"/>
			</fileset>
		</copy>
	</target>

	<target name="jar" description="生成paoding-analysis.jar">
		<delete file="paoding-analysis.jar" />
		<jar jarfile="paoding-analysis.jar" basedir="${classes}" compress="true"/>
	</target>

	<target name="build" depends="compile,jar" description="comple, jar"/>

</project>

分享到：

VIM 设置 | ANT的一些文章

2009-11-30 16:21
浏览 1084
评论(0)
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

庖丁分词jar包和dic目录: 标题中的“庖丁分词jar包和dic目录”指的是一个用于中文分词处理的软件工具，其中包含了必要的jar包和字典文件。庖丁分词是基于Java开发的一个高效、可扩展的中文分词库，它借鉴了Lucene的分词技术，并在此基础上...

庖丁分词jar包: 描述“庖丁分词的jar包”进一步确认了该文件的用途，即它是庖丁分词的可执行代码包，意味着开发人员可以利用这个jar包在自己的应用中实现中文文本的分词功能。标签“庖丁分词”是一个关键词，标识了这个软件工具的...

庖丁分词.jar: 庖丁分词.jar 庖丁分词.jar 庖丁分词.jar 庖丁分词.jar

lucene中文分词（庖丁解牛）庖丁分词: 《Lucene中文分词——庖丁解牛》在自然语言处理领域，中文分词是基础且关键的一环。在Java开发中，Apache Lucene是一个强大的全文搜索引擎库，但默认并不支持中文，这就需要借助第三方分词工具。本文将深入探讨...

庖丁分词测试数据集工具: 庖丁分词是一款在中文自然语言处理领域...总的来说，庖丁分词测试数据集为开发者提供了一个评估和改进分词算法的平台，通过对"data"文件中内容的深入分析和处理，可以不断提升庖丁分词在中文自然语言处理任务中的表现。

庖丁解牛中文分词工具: 分词技术在中文文本处理领域内占据着举足轻重的地位，因为它能将一连串的汉字拆分成有明确语义的单元，从而为后续的文本分析和应用提供便利。用户在使用"庖丁解牛"时，可以通过运行位于软件包中名为`analyzer.bat`...

最新庖丁分词源代码（for lucene3.0）: 庖丁分词是一款知名的中文分词工具，专为Apache Lucene搜索引擎库设计和优化。Lucene是一个开源全文检索库，广泛应用于各种信息检索系统。在本压缩包中，你将找到针对Lucene 3.0版本优化的庖丁分词源代码。 1. **...

庖丁分词归类: 在中文文本处理领域，分词是基础且关键的一环，它将连续的汉字序列切分成具有语义意义的词语，为后续的文本分析、信息提取、情感分析等任务提供基础。"庖丁分词"这个名字来源于古代典故“庖丁解牛”，寓意在处理复杂...

庖丁解牛分词 java包: "庖丁解牛分词" 是一款针对中文文本处理的分词工具，主要适用于Java环境。这个工具包的名称形象地借用中国古代故事“庖丁解牛”，寓意对文本的精细处理，如同庖丁对牛肉的熟练分解。在Java开发中，分词是自然语言...

庖丁分词工具: 庖丁中文分词需要一套词典，这些词典需要统一存储在某个目录下，这个目录称为词典安装目录。词典安装目录可以是文件系统的任何目录，它不依赖于应用程序的运行目录。将词典拷贝到词典安装目录的过程称为安装词典。...

庖丁解牛，一种中文分词器: "庖丁解牛"是一款专为处理中文文本的分词工具，它的设计目的是为了帮助开发者更高效、准确地对中文文本进行分词处理。在自然语言处理（NLP）领域，分词是基础且关键的一环，它将连续的文本序列切分成具有独立意义的...

sorlr + tomcat+ 庖丁解牛中文分词配置文档: 标题 "sorlr + tomcat+ 庖丁解牛中文分词配置文档" 提到的是一个关于在Apache Solr中集成Tomcat服务器，并利用庖丁解牛中文分词工具进行中文处理的配置教程。这个配置过程对于搭建支持中文搜索的Solr环境至关重要。...

庖丁解牛分词之自定义词库、庖丁解牛配置: 分词是将连续的汉字序列切分成有意义的词语单位，如“庖丁解牛”、“分词”等。在处理特定领域或专业术语时，系统内置的词库可能无法满足需求，这就需要自定义词库。自定义词库允许用户添加自己的专业词汇或者短语，...

庖丁中文分词在VB.NET的使用例子方法: 在VB.NET环境下使用庖丁中文分词，首先需要将庖丁的DLL文件引入项目中。从给定的部分内容可以看出，代码中通过`Application.StartupPath`获取了项目的启动路径，并以此为基础定位到存放庖丁DLL文件的位置。`pangu_...

支持lucne4.X的庖丁分词jar包: 支持lucne4.X的庖丁分词jar包,自己打的jar包，保准好用

庖丁解牛分词源码: 1. **中文分词**：中文分词是中文文本处理的重要步骤，因为中文句子没有明显的空格分隔单词，需要通过特定算法将连续的汉字序列切分成有意义的词汇。庖丁解牛分词器采用了基于字典匹配的分词策略，同时也结合了统计...

lucene 中文分词庖丁解牛: 中文分词是中文信息处理的核心环节，因为中文词汇之间没有明显的分隔符，因此需要通过特定算法将连续的汉字序列切割成有意义的词语。正确的分词结果直接影响到搜索引擎的查准率和查全率，进而影响用户体验。三、...

lucene3庖丁解牛中文分词器: 《深入剖析：Lucene3与庖丁解牛中文分词器》在信息技术飞速发展的今天，全文检索和搜索引擎已经成为日常开发中不可或缺的部分。Lucene作为一款强大的全文检索库，被广泛应用于各种信息检索系统中。然而，对于中文...

paoding analysis 3.0.1 jar (庖丁解牛分词器): 由于庖丁官方目前提供可下载尚不支持Lucene 3.0以上版本。因此作者对paoding进行重新编译，使其与最新Lucene 3.0.1版本适用。 Latest paoding 3.0.1 for lucene 3.0.1 使用说明：先下载2.0.4的版本（h t t p : / ...

lucene Analyzer 庖丁解牛中文分词: 《Lucene Analyzer剖析：中文分词的奥秘》在信息检索领域，Lucene作为一款强大的全文搜索引擎库，被广泛应用于各种系统中。其核心功能之一就是对输入文本进行高效精准的分词处理，以便进行后续的索引和查询操作。...

Global site tag (gtag.js) - Google Analytics