`

Collections工具类中的frequency方法统计单词出现的次数

 
阅读更多

最近发现了一个Collections中有一个很好用的方法:frequency,主要是用来统计单词出现的次数,有了这个方法后,我们又可以少写很多代码了。

 

下面是方法的用途:(一个简单的实例能说明一下)

 

String strs = "zhangsan zhangsanfeng lisi lisi wangwu wangwuliu zhangwuji zhou zhouzhinuo";
		System.out.println(strs);
		List<String> tempList = Arrays.asList(strs.split(" "));
		for(String stemp:tempList){
			System.out.println(stemp+" ->出现次数:"+Collections.frequency(tempList, stemp));
		}

 

 

输出结果如下:

zhangsan zhangsanfeng lisi lisi wangwu wangwuliu zhangwuji zhou zhouzhinuo
zhangsan ->出现次数:1
zhangsanfeng ->出现次数:1
lisi ->出现次数:2
lisi ->出现次数:2
wangwu ->出现次数:1
wangwuliu ->出现次数:1
zhangwuji ->出现次数:1
zhou ->出现次数:1
zhouzhinuo ->出现次数:1

 

分享到:
评论

相关推荐

    caculate-windows.zip

    接下来,使用Python的`collections.Counter`类来统计每个单词的出现次数: ```python word_counts = Counter(filtered_text) ``` `Counter`对象会返回一个字典,其中键是单词,值是对应的出现次数。 最后,我们要...

    Python 遍历词频统计

    这个“Python遍历词频统计”工具可能是用于读取文本文件,计算并输出文本中各个单词出现的次数,以了解文本的主要内容和特征。 在Python中,实现词频统计通常会用到以下知识点: 1. **字符串操作**:首先,我们...

    Q.rar_python统计词频_分词_基于机器学习_词频 _词频统计

    例如,可以使用TF-IDF(Term Frequency-Inverse Document Frequency)模型,它考虑了词汇在整个文档集中的分布情况,使得那些只在一个文档中出现的词具有更高的权重。此外,还可以通过训练词嵌入模型(如Word2Vec或...

    WordFrequency213

    标题“WordFrequency213”和描述中的信息虽然简洁,但可以推测这可能是一个关于词频统计的项目或工具,可能使用Java编程语言实现。在这个项目中,我们有两个主要的文件:`weibo.txt`和`WordFrequency`。`weibo.txt`...

    frequency_counter:计算一列中单词的出现频率

    标题提到的"frequency_counter"就是一个这样的工具,它用于统计一列单词的出现次数。在这个场景下,我们可以深入探讨Python中实现这种功能的方法和相关知识点。 首先,我们需要导入Python的内置模块`collections`,...

    基于python的词频统计源码

    - **词频(Term Frequency, TF)**:表示某个词在文档中出现的次数,是衡量词的重要性的基础指标。 - **词频-逆文档频率(Term Frequency-Inverse Document Frequency, TF-IDF)**:是TF的一个改进,考虑了词在...

    count_word_freq.py.zip_count_frequency_word

    "count_word_freq.py.zip_count_frequency_word"这个压缩包文件包含了一个名为`count_word_freq.py`的Python脚本,其目的显然是为了统计一段文本中各个单词出现的频率。下面将详细介绍如何实现这一功能,以及相关的...

    词频统计1111111111111111111.rar

    例如,可以使用`System.IO`命名空间下的`StreamReader`类读取文本文件,然后通过`String.Split()`方法将文本分割成单词,接着用哈希表(如`Dictionary, TValue&gt;`)存储每个单词及其对应的出现次数。这里,标签“泛型...

    word-frequency

    描述中的 "word-frequency" 进一步强化了这一主题,它可能是一个脚本或程序,用于统计文本中各个单词出现的次数。这样的应用可能被用于各种场景,如搜索引擎优化、文本挖掘、情感分析或者语言模型的训练。 标签 ...

    Python期末考试代码合集

    它表示某个词语在文本中出现的次数,通常用于评估文本内容的重点。Python中,`collections`库的`Counter`类可以方便地统计词频,`nltk`库则提供了更复杂的文本处理功能,如分词、停用词移除等,以提高词频分析的准确...

    Fenci.rar_词频 _词频分析 python

    首先,词频分析(Term Frequency,简称TF)是统计分析文本中各个词汇出现的次数,用于衡量某个词在文档中的重要性。在Python中,我们可以借助一些强大的库来实现这一功能,例如`nltk`(Natural Language Toolkit)和`...

    python项目实例代码源码-用Python分析文本数据的词频.zip

    这个类可以方便地计算每个单词出现的次数,并按频率排序。例如,代码可能包含`from collections import Counter`,接着创建一个Counter对象,如`word_counts = Counter(tokens)`,其中`tokens`是分词后的单词列表。 ...

    python源码-案例框架-自动办公-19 用Python分析文本数据的词频.zip

    使用`collections`模块中的`Counter`类可以轻松统计词频。将预处理后的词汇列表传递给`Counter`,它会返回一个字典,其中键为词汇,值为该词汇出现的次数。 4. **数据可视化**: 对于结果的可视化,`matplotlib`...

    Python-Reptile-English-Documents-master.zip

    接下来,分析阶段可能包括词频统计,这可以通过Python的collections.Counter类实现。通过对文档中所有单词进行计数,可以找出出现频率最高的词汇,揭示哪些词汇在英语中较为常见或流行。此外,还可以使用TF-IDF...

    频率计数器

    在编程领域,特别是在Python语言中,我们也可以创建类似的“频率计数器”来统计数据集中各个元素出现的次数。本文将深入探讨如何在Python中实现这样的功能,并提供相关的代码示例。 Python中的频率计数器主要依赖于...

    基于Python实现的文本特征提取,适用于小说,论文,议论文等文本,提取词语、句子、依存关系等特征

    - **词频统计**:计算每个词语在文本中的出现频率,可以使用collections.Counter或sklearn.feature_extraction.text.CountVectorizer。 - **TF-IDF**:一种衡量词语重要性的方法,它结合了词频(Term Frequency)...

    frequencyAnalysis

    我们可以读取一段文本或文件内容,然后用`Counter`来统计每个字符或单词出现的次数,从而得到频率分布。 例如,以下是一个简单的Python代码片段,用于计算文本文件中每个字符的频率: ```python from collections ...

    Frequencycount

    - **文本分析**:统计文本中单词的出现频率,帮助理解文本的主题。 - **异常检测**:在数据清洗中,找出出现频率异常的元素,可能是错误的数据或噪声。 - **模式识别**:在序列数据中,频率计数可以揭示重复模式...

    Content-Analysis-2020:计算内容分析2020的作业

    3. 词频分析:统计文本中每个词出现的次数,以识别最常见的关键词。这可以通过Python的collections.Counter类或者pandas库中的value_counts()函数实现。 4. 文本向量化:将文本数据转换为数值形式,以便机器学习...

    ENDGAME

    这段代码首先计算了文本中每个单词的出现次数,然后绘制出最常见的10个单词及其频率。 在"ENDGAME-main"这个文件中,可能包含了一个或多个这样的示例或者一个完整的项目,涉及到了对简单文本数据的处理、分析和可视...

Global site tag (gtag.js) - Google Analytics