词性的重要性不言而喻,尤其是对于自然语言处理来说,哪怕就是记单词,根据词性对单词进行归组也是非常有帮助的。
superword是一个Java实现的英文单词分析软件,主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。
各大词性及其包括的词:
32、N-COUNT-COLL(可数集合名词) (词数:50)
33、N-FAMILY(家庭成员名词) (词数:6)
1 | aunt | father | grandfather | grandmother | mother |
2 | uncle |
34、N-IN-NAMES(名称名词) (词数:87)
35、N-MASS(物质名词) (词数:167)
36、N-PLURAL(复数名词) (词数:420)
37、N-PROPER(专有名词) (词数:40)
38、N-PROPER-COLL(专有集合名词) (词数:6)
1 | common | commonly | cub | labour | lord |
2 | senate |
39、N-PROPER-PLURAL(专有复数名词) (词数:1)
1 | crusade |
40、N-SING(单数名词) (词数:721)
41、N-SING-COLL(单数集合名词) (词数:24)
1 | abundance | artillery | bench | brass | clientele |
2 | community | cream | crew | defence | enemy |
3 | floor | guard | headquarters | laity | left |
4 | majority | media | ministry | nobility | opposition |
5 | police | press | public | right |
42、N-TITLE(头衔名词) (词数:53)
43、N-UNCOUNT(不可数名词) (词数:2038)
44、N-UNCOUNT-COLL(不可数集合名词) (词数:10)
1 | algae | club | diamond | flora | heart |
2 | infantry | livestock | logistics | prey | spade |
45、N-VAR(可变名词) (词数:938)
46、N-VAR-COLL(可变集合名词) (词数:2)
1 | management | membership |
47、N-VOC(称呼名词) (词数:53)
1 | Mister | baby | beast | bishop | boy |
2 | brother | bud | buddy | captain | chairman |
3 | colonel | commander | comrade | constable | darling |
4 | dear | detective | doctor | duck | eminence |
5 | father | folk | general | gentleman | grace |
6 | guy | honey | honour | inspector | kid |
7 | lad | lady | lord | lordship | love |
8 | madam | maestro | majesty | major | man |
9 | mate | miss | nurse | pet | professor |
10 | sir | sister | son | speaker | sugar |
11 | sweet | vicar | woman |
48、NEG(否定词) (词数:1)
1 | not |
49、NUM(数词) (词数:38)
50、ORD(序数词) (词数:15)
1 | eighth | eleventh | fifth | first | fourth |
2 | last | next | ninth | second | seventh |
3 | sixth | tenth | third | twelfth | twentieth |
51、PREDET(前置限定词) (词数:8)
1 | all | double | many | quite | such |
2 | treble | triple | what |
52、PREP(介词) (词数:80)
1 | aboard | about | above | absent | across |
2 | after | against | alias | along | alongside |
3 | amid | amidst | among | amongst | apropos |
4 | around | as | at | bar | before |
5 | behind | below | beneath | beside | besides |
6 | between | beyond | but | by | come |
7 | concerning | considering | despite | down | during |
8 | except | following | for | from | given |
9 | half | in | inside | into | less |
10 | like | minus | near | notwithstanding | of |
11 | off | on | onto | opposite | outside |
12 | over | past | pending | per | regarding |
13 | round | save | since | than | through |
14 | throughout | till | to | towards | under |
15 | underneath | unlike | until | up | upon |
16 | versus | via | with | within | without |
53、PRON(代词) (词数:20)
1 | all | better | either | enough | first |
2 | former | it | last | latter | least |
3 | many | more | one | same | that |
4 | there | these | this | those | you |
54、PRON-EMPH(强调代词) (词数:1)
1 | all |
55、PRON-INDEF(不定代词) (词数:8)
1 | anybody | anyone | anything | everyone | everything |
2 | somebody | someone | something |
56、PRON-INDEF-NEG(否定不定代词) (词数:2)
1 | nobody | nothing |
57、PRON-PLURAL(复数型代词) (词数:5)
1 | them | they | us | we | you |
58、PRON-POSS(所有格代词) (词数:5)
1 | hers | mine | ours | theirs | yours |
59、PRON-RECIP(相互代词) (词数:2)
1 | another | each |
60、PRON-REFL(反身代词) (词数:8)
1 | herself | himself | itself | myself | oneself |
2 | ourselves | themselves | yourself |
61、PRON-REFL-EMPH(强调反身代词) (词数:8)
1 | herself | himself | itself | myself | oneself |
2 | ourselves | themselves | yourself |
62、PRON-REL(关系代词) (词数:8)
1 | that | when | whereby | which | who |
2 | whom | whose | why |
63、PRON-SING(单数型代词) (词数:7)
1 | I | he | her | him | it |
2 | me | us |
64、QUANT(数量词) (词数:44)
1 | bag | bit | bucket | bulk | bunch |
2 | certain | couple | deal | dealing | dozen |
3 | each | generality | heap | host | hundred |
4 | iota | jot | load | lot | mass |
5 | modicum | most | mountain | much | multiplicity |
6 | multitude | myriad | none | one | part |
7 | piece | pile | plenty | pot | remainder |
8 | rest | score | some | spot | thousand |
9 | touch | touched | welter | whole |
65、QUANT-PLURAL(复数数量词) (词数:2)
1 | billion | million |
66、QUEST(疑问词) (词数:14)
1 | how | however | what | whatever | when |
2 | whence | where | wherever | which | who |
3 | whoever | whom | whose | why |
67、SOUND(声音词) (词数:2)
1 | bang | crack |
68、SUFFIX(后缀) (词数:1)
1 | lier |
69、V(动词) (词数:3881)
70、V-ERG(动词(及物/不及物)) (词数:511)
71、V-LINK(连系动词) (词数:26)
1 | appear | be | become | being | come |
2 | constitute | equal | fall | feel | get |
3 | go | grow | lie | look | make |
4 | play | prove | remain | remains | represent |
5 | seem | smell | sound | stand | stay |
6 | turn |
72、V-LINK-ERG(连系动词(及物/不及物)) (词数:2)
1 | keep | turn |
73、V-PASSIVE(被动动词) (词数:37)
74、V-RECIP(相互动词) (词数:112)
75、V-RECIP-ERG(相互动词(及物/不及物)) (词数:43)
76、V-RECIP-PASSIVE(被动相互动词) (词数:1)
1 | reconcile |
相关推荐
其次,文件按照年级和学期进行了细分,如“高一英语单词(上).txt”和“高一英语单词(下).txt”,分别代表高一年级上学期和下学期的词汇。这样的划分有助于学生按照教学进度逐个击破,避免一次性面对大量单词带来的...
词性分类可以帮助我们更好地理解单词在句子中的功能和意义。以下是关于10种主要英语词性的详细解释: 1. **名词(n.)** - 名词是表示人、事物、地点、概念等的词汇,如"box"、"pen"、"tree"、"apple"。它们可以是可...
为了确保学生对名词的理解和运用,课堂导入环节可以通过展示一组单词(如dictionary, rice, knowledge, face, man, mouse, China, table)引导学生发现它们的共同特性——都是名词。同时,教师可以结合上节课的内容...
对于认识的多词性单词,如display、concern、challenge,要标记所有可能的词性。对于以-ing、-ed结尾的词,要考虑它们可能既是动词也是形容词。 4. **处理近义词和反义词**:若选项中出现近义词或反义词,通常会有...
1. **细分选项**:对名词、动词等进行更细致的分类,例如名词的单数、复数和不可数,动词的各种时态和语态等。 2. **处理指示代词**:当选项中出现指示代词如it、they、one等时,需注意它们在句中的位置和指代的...
接着,学习者要对这个“语言岛”进行词性划分,将不同词性的词汇分配到相应的区域。比如,名词对应特定的地点,描述词放在花园,动词与运动场所相联。这种基于词性的分类有助于学习者快速定位和检索词汇,提高记忆和...
5. **判断空缺词性**:在填空题中,根据句子结构判断所需单词的词性。例如: - 句子只有一个谓语动词。 - 名词通常充当主语或宾语。 - 形容词或名词可以修饰名词。 - 限定词后面必须跟名词。 - 谓语动词前要有...
在准备N1词汇表时,一般会按照词性、主题、常用程度等进行分类,便于记忆和复习。例如,可能会有动词、名词、形容词、外来词等部分,每个部分又会细分出高频词汇和专业词汇。同时,学习者还会接触到一些固定搭配、...
- **中文分词与词性标注**:对提取的文本进行中文分词处理,并对分词后的词语进行词性标注,去除停用词后得到可用于训练的文本数据。 ##### 3.2 中文分词 中文分词是将连续的汉字序列切分成具有实际意义的词汇的...
这种方法主张将单词按其内在的逻辑关系和语义关联进行分类,如物质世界、人类社会、科学思维等大类,然后在每个类别下再细分。通过形成有意义的关联,记忆单词不再是孤立的,而是相互关联的整体,这有助于考生更有效...
3. 词性标注:在分词基础上,对每个词语进行词性标注,如动词、名词、形容词等。 4. 命名实体识别:识别文本中的专有名词,如地名、人名等。 5. 依存关系分析:分析词语之间的依存关系,以理解句子的结构。 在处理...
在这个数据集中,虽然所有的新闻都属于“社会”类别,但可以通过进一步的细分,比如地域、事件类型等,创建多级分类体系。这有助于研究人员分析社会新闻的热点话题和趋势,同时也可以用于训练和评估更复杂的分类模型...
本研究提出了一个基于转移的联合模型,用于进行单词切分、词性标注和文本规范化。与传统方法不同,所提模型能够利用标准文本语料库进行训练,这在一定程度上解决了注释的微博语料库不足的问题。为了评估该模型的有效...
接下来是单词的词性和用法练习: 1) thread:作为名词时,表示“线”,如“她没能把线穿过针眼”。作为动词时,表示“穿过去”,如“He threaded through the throng.”(他穿过人群。) 2) round:作为动词时,表示...
转化法也是专业英语词汇构成的一种方式,它涉及改变单词的词性,使得单词能够在不同的语境下表达不同的意义。例如,一个形容词在特定语境下可能被用作名词使用。 派生法是利用词缀(前缀、后缀)和词根相结合的方式...
导入nltk(自然语言工具包),它由最常用的算法组成,例如标记化,词性标记,词干,情感分析,主题细分和命名实体识别。 NLTK帮助计算机分析,预处理和理解书面文本。 使用“停用词”摆脱英语单词,这些单词不会给...
根据给定文件的信息,我们可以提炼出以下相关的知识点: ### 完形填空篇 #### 一、考情分析 1. **题型概述** - **定义与来源**:考研英语中的完形填空(Cloze Test)源自西方完型心理学的概念Closure。这种题型...
这时需要进行细致的分析和调整,例如利用动态规划算法(如Viterbi算法)优化路径,或者结合词性标注进行二次分词,提高分词准确性。 5. **分词分析**:最后,我们需要对分词结果进行评估,常见的评估指标有准确率、...
解剖学可以进一步细分为以下几类: 1. 大体解剖学(Gross Anatomy): - 表面解剖学(Surface Anatomy):研究身体表面可观察到的结构。 - 局部解剖学(Regional Anatomy):关注特定身体区域的解剖结构。 - ...