`

检索出文本中出现次数最多的单词

 
阅读更多

原创转载请注明出处:http://agilestyle.iteye.com/blog/2392423

 

具体思路,将文本中的段落进行split拆分成一个个单词,然后遍历,放入map,统计每个单词出现的次数,最后放入list,按出现次数进行降序排列

Note:此方法不是最优解,还有更高效的算法,欢迎拍砖

 

package org.fool.test;

import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

public class Test {
    public static void main(String[] args) {
        String str = "Ah, Ah, Ah, What the hell are you talking about, I have already told you what you should do, I really have no idea what you think about";
        String[] strings = str.replace('\'', ' ').replace(',', ' ').replace('.', ' ').split("\\s+");

        Map<String, Integer> map = new HashMap<>();
        for (String s : strings) {
            if (map.containsKey(s)) {
                map.put(s, map.get(s) + 1);
            } else {
                map.put(s, 1);
            }
        }

        List<Map.Entry<String, Integer>> list = new ArrayList<>(map.entrySet());

        list.sort((o1, o2) -> o2.getValue() - o1.getValue());

        System.out.println(list.get(0).getKey() + ":" + list.get(0).getValue());
        System.out.println(list.get(1).getKey() + ":" + list.get(1).getValue());
    }
}

Console Output


 

 

 

  • 大小: 10.5 KB
分享到:
评论

相关推荐

    自动统计文本中单词出现最多的单词

    本话题聚焦于“自动统计文本中单词出现最多的单词”,这涉及到一系列的技术和方法,让我们一起来深入探讨。 首先,我们要理解什么是“单词统计”。在文本分析中,单词统计是指计算文本中各个单词出现的频率,以此来...

    文本文件单词的检索与计数

    检索输出某个单词出现在文本中的行号、在该行中出现的次数以及位置。 该设计要求可分为三个部分实现:其一,建立文本文件,文件名由用户用键盘输入;其二,给定单词的计数,输入一个不含空格的单词,统计输出该单词...

    统计文本文件中一段英文中某个单词出现的次数及其出现的位置

    统计文本文件中一段英文中某个单词出现的次数及其出现的位置 本知识点介绍了一个使用 C++ 编程语言编写的程序,旨在统计给定英文文本文件中某个英文单词的出现次数及其出现的位置。下面是对该程序的详细解释: ...

    一个文本在另一个文本中出现的次数

    在信息检索、文本分析以及自然语言处理领域,计算一个文本在另一个文本中出现的次数是一项基础且重要的任务。这项任务通常涉及到字符串匹配、文本相似度计算以及信息提取等多个方面。以下将详细介绍这一知识点。 ...

    文本文件检索,数据结构课程设计

    在数据结构课程设计中,文本文件检索是一项常见的实践任务,它涉及到计算机科学中的核心概念,如文本处理、算法设计和数据结构的运用。本项目利用MFC(Microsoft Foundation Classes)库构建了一个可视化的用户界面...

    利用IOS统计文本中单词出现的次数

    在iOS开发中,统计文本中单词出现的次数是一项常见的任务,尤其在数据分析、文本处理或者信息检索等场景中。为了实现这一功能,开发者通常需要掌握iOS的基础编程,数据结构(如字典)以及数据传递的方法。以下将详细...

    文本文件单词的检索和计数

    如果需要找出所有出现过该单词的行和列信息,我们需要再次遍历文件,比较每一行中的每个单词,当找到匹配的单词时,输出对应的行号和当前字符位置。 最后,退出程序时,别忘了调用`close()`方法关闭文件,释放系统...

    WBDC.rar_c text word count_单词检索_文本 检索 visual_文本文件读写

    单词计数分为两部分:一是检索过程中统计每个特定单词出现的次数,二是计算整个文件中的总单词数。前者需要一个哈希表或关联数组来存储每个单词及其出现次数;后者则需要遍历整个文件,每遇到一个空格、标点符号或...

    统计字符串中每个字符出现次数并排序工具

    本文将介绍一种专门用于统计字符串中每个字符出现次数并进行排序的工具,它能够帮助用户快速了解一段文本的主要构成元素,找出最频繁出现的字符。 标题中的"统计字符串中每个字符出现次数并排序工具"是一个实用的...

    字典树应用,检索文本文件单词

    在本项目中,“字典树应用,检索文本文件单词”是用C语言实现的一个基础工具,它的主要功能是对文本文件进行遍历,统计其中每个单词出现的次数,并记录它们所在的行数以及在行中的位置。这样的功能对于文本分析、词频...

    人工智能-项目实践-信息检索-基于不同策略的英文单词的词频统计和检索系统

    信息检索是一门研究如何快速准确地从大量文本数据中找出相关信息的学科。常见的信息检索系统包括搜索引擎、文档管理系统等。在这个项目中,我们可能采用了倒排索引(Inverted Index)技术,这是一种将单词映射到包含...

    文本文件单词的检索与计数(流程图).docx

    该系统主要包括四个模块:建立文本文件、给定单词的计数、检索单词出现在文本文件中的行号、次数及其位置和主控菜单程序。 一、建立文本文件 建立文本文件的实现思路是定义一个串变量,定义文本文件,输入文件名,...

    一个查询文本出现单词次数及位置的代码

    大概是写的和屎一样的东西,但是它是... //统计查询单词出现次数及位置 void Textcount(); //统计文本总单词数量 }; void Menu()//菜单 { cout ; cout ; cout 单词检索统计程序" ; cout ; cout 建立文本文件"

    文本文件字符串的检索和计数(KMP算法)

    该程序主要功能可分为 1.为用户在本地建立一个文本文件,并且支持录入换行功能,字符序列构成且区分大小写 2.统计给定单词在文本文件中...3.检索输出某个单词某个单词出现在文本中的行号、在改行中出现的次数以及位置。

    数据结构文本检索与计数

    5. 函数设计:根据题目描述,本系统包括四个功能模块:创建文本文件、统计单词次数、输出单词位置。每个功能可以封装为一个独立的函数,如`createFile()`, `countWord()`, `printPositions()`,这有利于代码的组织和...

    c语言程序统计英语文章中的单词出现不同的单词

    该C语言程序旨在统计英文文章中每个单词出现的次数,并且特别关注只出现一次的单词。以下是程序的主要知识点和步骤: 1. 文件操作: - 使用`fopen()`函数打开文本文件"test.txt",模式设为"rb",表示以二进制方式...

    C#英文词频统计-统计单词出现次数

    词频统计是指在给定文本中计算每个单词出现的频率,它对于文本挖掘、信息检索和自然语言处理等领域具有重要意义。通过词频统计,我们可以发现文本中最常出现的词汇,这些高频词汇往往反映了文本的核心内容。 在C#中...

    文本文件单词的检索和计数课程设计汇本实验报告.doc

    单词的计数是指统计文本文件中某个单词的出现次数。该过程可以分为以下步骤: (1)逐行扫描文本文件,并将单词与目标单词进行匹配。 (2)如果匹配成功,则计数器加 1。 (3)直到整个文件扫描结束,然后输出...

Global site tag (gtag.js) - Google Analytics