stanford postagger stagsets
stanford出的postagger用的词性标签集正是pen的词性标签集。
The Penn Treebank Tag SetThe Penn Treebank Tag Set
The tagset used in tagging the demo corpus available here is the Penn Treebank
Tag set, described for example in Mitchell P. Marcus, Beatrice Santorini, and
Mary Ann Marcinkiewicz: Building a Large Annotated Corpus of English: The Penn
Treebank, in Computational Linguistics, Volume 19, Number 2 (June 1993), pp.
313--330 (Special Issue on Using Large Corpora). The tagging was done at UPenn.
The following part-of-speech tags are used in the corpus:
1. CC Coordinating conjunction 并列连词
2. CD Cardinal number 基数
3. DT Determiner 限定词
4. EX Existential there THERE存在式
5. FW Foreign word 外来词
6. IN Preposition or subordinating conjunction 介词或者从属连词
7. JJ Adjective 形容词
8. JJR Adjective, comparative形容词的比较级
9. JJS Adjective, superlative形容词的最高级
10. LS List item marker列表标记
11. MD Modal 情态动词
12. NN Noun, singular or mass 名词,单数或物质名词。
13. NNS Noun, plural 名词复数形式
14. NP Proper noun, singular 专有名词,单数形式
15. NPS Proper noun, plural 专有名词,复数形式
16. PDT Predeterminer 前位限定词
17. POS Possessive ending 's
18. PP Personal pronoun 人称代词,也称"PRP"
19. PP$ Possessive pronoun 物主代词,也称"PRP$"
20. RB Adverb 副词
21. RBR Adverb, comparative 副词(程度副词的比较结构)
22. RBS Adverb, superlative 副词(程度副词的最高级)
23. RP Particle 小品词
24. SYM Symbol 代号
25. TO to 就是一个 “TO” !
26. UH Interjection 感叹语
27. VB Verb, base form 动词原形
28. VBD Verb, past tense 动词过去式
29. VBG Verb, gerund or present participle动词现在分词
30. VBN Verb, past participle 动词过去分词
31. VBP Verb, non-3rd person singular present 动词,非第三人称单数形式。
32. VBZ Verb, 3rd person singular present第三人称单数形式
33. WDT Wh-determiner WH限定词
34. WP Wh-pronoun WH代词
35. WP$ Possessive wh-pronoun WH物主代词
36. WRB Wh-adverb WH副词
其中的功能词(剩下的是实义词)
1. CC Coordinating conjunction 并列连词
3. DT Determiner 限定词
6. IN Preposition or subordinating conjunction 介词或者从属连词
11. MD Modal 情态动词
18. PP Personal pronoun 人称代词,也称"PRP"
19. PP$ Possessive pronoun 物主代词,也称"PRP$"
23. RP Particle 小品词
25. TO to 就是一个 “TO” !
33. WDT Wh-determiner WH限定词
34. WP Wh-pronoun WH代词
35. WP$ Possessive wh-pronoun WH物主代词
IMS Stuttgart / WWW@IMS.Uni-Stuttgart.DE / Tue May 19 18:04:13 1998 (hofmanaa)
-------------------------------------------------------------------
图灵门徒后记:在GOOGLE上不经意发现自己的文章可以搜到,马上修正完善其中的翻译。野人献曝啊。
分享到:
相关推荐
使用stanford postagger词性标注 //标注 String model = " models=chinese.tagger";= string=content="你们 是祖国美丽盛开的花朵";=MaxentTagger= tagger="new
《NLP汉语自然语言处理原理与实践》...本文针对书中第24页“安装StanfordNLP并编写Python接口类”部分的程序,列出在版本升级后出现的问题,以及相应的解决方案。本文也可以单独作为学习StanfordNLP工具包的学习文档。
StanfordCoreNLP适用于以下情形: 一个具有广泛语法分析工具集成的NLP工具包; 一种广泛应用于生产中的快速、健壮的任意文本注释器;...一个现代化的具有全面高质量的文本分析功能的、定期更新的软件包
对英文单词的词性标注 自然语言处理相关资源还有english-left3words-distsim.tagger见我的上传资源
此外,请注意,Stanford PoS-Tagger 是在下获得,而不是本模块的一部分。 它的大小为128 MB,并附带21种型号。 它会在npm install上从其外部源自动下载。 使用此 Node.js 模块的应用程序必须考虑斯坦福 PoS-Tagger ...
在自然语言处理(NLP)领域,Stanford CoreNLP是一个强大的工具,它提供了多种功能,包括分词、词性标注、命名实体识别等。在C#编程环境中,调用Stanford CoreNLP可以帮助开发者处理中文文本,进行复杂的语言分析。...
Stanford Parser 中文句法分析器使用教程 Stanford Parser 是一种功能强大的中文句法分析器,它可以对中文句子进行依存关系分析,生成句法树和词性标注。下面是使用 Stanford Parser 进行中文句法分析的教程。 一...
首先,为了在Python中使用Stanford Parser,我们需要下载Stanford CoreNLP的Java版本以及对应的Python库`stanfordnlp`。确保你的系统已经安装了Java运行环境,然后从Stanford NLP官网下载最新的CoreNLP软件包。同时...
斯坦福核心NLP(Stanford CoreNLP)是斯坦福大学开发的一个强大的自然语言处理工具包,它提供了多种功能,如词性标注、命名实体识别、句法分析、情感分析等,广泛应用于学术研究和实际应用中。此次我们关注的是其...
Stanford Tregex是一款由斯坦福大学自然语言处理组(NLP Group)开发的强大工具,它在语言处理领域中被广泛使用。Tregex是“Tree Regular Expressions”的缩写,是一种结合了正则表达式和句法树匹配的概念,用于在...
Stanford Graphics 3.0c 是一款专为数据处理设计的软件,尤其在制作高质量图表方面表现出色。这款工具以其高效、易用和便携性赢得了用户的青睐,它的小巧体积使得用户可以轻松地将其存储在移动设备上,随时随地进行...
标题中的“Stanford WordLadder”和“Randomwriter”是两个特定的程序或工具,它们在IT领域,尤其是自然语言处理(NLP)方面有一定的应用。让我们分别详细探讨这两个概念。 **Stanford WordLadder** Stanford Word...
stanford-corenlp-3.9.2-models.jar
Stanford Graphics:美国斯坦福大学很好用的数据处理软件Stanford Graphics,可以利用数据完美作图。 安装说明:在0文件夹里选择安装INSTALLv.EXE文件,出现窗口提示的时候,依次输入1、2、3、4即可,输入四次后,...
《斯坦福大学NLP工具包:stanford-corenlp-full-2015-12-09.zip深度解析》 斯坦福大学的NLP(自然语言处理)工具包是学术界和工业界广泛使用的资源,它包含了丰富的功能,能够满足多样的自然语言处理任务需求。...
Stanford Sentiment Treebank 是一个标准情感数据集,主要用于情感分类,其中每个句子分析树的节点均有细粒度的情感注解。 该数据集由斯坦福大学的 NLP 组发布,其中句子和短语共计 239232 条,相较于忽略单词顺序...
斯坦福车 196 类 训练集,图片按类别文件夹存放,完整数据集下载: https://github.com/cyizhuo/Stanford-Cars-dataset
这是《听说越来越卷,那我们就用卷积神经网络CNN来识别狗狗吧!!》这篇博文中所使用的数据集,免费放在这里供大家使用了啦。