`
美丽的小岛
  • 浏览: 310788 次
  • 性别: Icon_minigender_1
  • 来自: 大连
社区版块
存档分类
最新评论

统计文章的单词个数

    博客分类:
  • java
 
阅读更多
package com.lr.string;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.ArrayList;
import java.util.Collections;
import java.util.Comparator;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.StringTokenizer;

public class WordCount {
	public static void main(String[] args) {
		String str = null;
		int WordCount = 0;
		Map<String, Integer> map = new HashMap<String, Integer>();
		List<Map.Entry<String, Integer>> listMap = null;
		try {
			BufferedReader br = new BufferedReader(new InputStreamReader(
					new FileInputStream(new File(
							"src/com/lr/string/WordCount.java"))));
			while ((str = br.readLine()) != null) {
				StringTokenizer token = new StringTokenizer(str);
				while (token.hasMoreTokens()) {
					String word = token
							.nextToken("+*!:@=\\\"\';?><,./\n\t {()");
					if (map.containsKey(word)) {
						map.put(word, map.get(word) + 1);
					} else {
						map.put(word, 1);
					}
					WordCount++;
				}
			}// while
			listMap = new ArrayList<Map.Entry<String, Integer>>(map.entrySet());
			Collections.sort(listMap,
					new Comparator<Map.Entry<String, Integer>>() {
						@Override
						public int compare(Map.Entry<String, Integer> map1,
								Map.Entry<String, Integer> map2) {
							return (map1.getValue().compareTo(map2.getValue()));
						}
					});
			for (Map.Entry<String, Integer> m : listMap) {
				System.out.println(m.getKey() + ":" + m.getValue());
			}
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
}

 结果:

getKey:1
for:1
args:1
package:1
println:1
else:1
static:1
get:1
compare:1
nextToken:1
class:1
compareTo:1
0:1
String[]:1
readLine:1
try:1
sort:1
entrySet:1
if:1
src:1
System:1
return:1
n:1
void:1
main:1
hasMoreTokens:1
containsKey:1
t:1
Override:1
out:1
InputStreamReader:2
com:2
br:2
Collections:2
int:2
1:2
FileNotFoundException:2
map2:2
map1:2
printStackTrace:2
put:2
IOException:2
lr:2
Comparator:2
catch:2
ArrayList:2
List:2
HashMap:2
File:2
FileInputStream:2
string:2
StringTokenizer:3
str:3
getValue:3
while:3
token:3
null:3
m:3
BufferedReader:3
public:3
listMap:4
WordCount:4
e:4
word:5
Entry:6
map:6
io:6
util:7
Map:8
new:8
Integer:8
String:10
}:12
import:13
java:14

 

1
1
分享到:
评论

相关推荐

    统计文章单词数量

    统计所需搜索的文件的每个单词的数量和单词的名字,直观反映在桌面

    用c++写的统计英文文章中的单词个数

    以上就是用C++统计英文文章单词个数和字母频率的基本步骤和涉及的知识点。在实际编写代码时,应考虑代码的效率、可读性和可扩展性。例如,对于大规模文本,可以考虑使用更高效的数据结构(如哈希表)来统计字母频率...

    Spark Scala简单 统计单词个数

    该资源可以简单计算文本中单词个数

    统计文章单词数并按字典序输出

    统计一篇文章中的单词数并按字典序输出,采用二叉查找树

    1400:统计单词数

    一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中出现的次数。 现在,请你编程实现这一功能,具体要求是:给定一个单词,请你输出它在给定的文章中...

    C语言实现统计文章的单词数目(实验报告+源代码)

    【实验报告】 ...总结,这个C语言程序实现了对英文文章单词的统计功能,通过文件操作和字符串处理,提高了编程者的实践能力。在实际应用中,可以结合文件读写、错误处理等模块,使其成为一个完整的实用工具。

    java统计文章的英文个数

    在Java编程中,统计文章中的英文字符个数是一项常见的任务,尤其在文本处理或数据分析的场景下。这个任务可以通过读取文件内容,然后对每个字符进行判断来完成。以下是一些关于如何实现这一功能的关键知识点: 1. *...

    c++课程设计单词频率统计

    ,这个函数包括了打开文件并显示里面的内容,将英文文章存放到链表的功能(此时因为考虑到文章中会含有标点符号,调用去标点的成员函数去掉标点,因此链表结点中的单词是纯单词,不含标点符号,调用结束后会返回纯...

    统计单词 统计文章中单词的个数

    统计单词个数意味着我们需要识别这些分隔符并计算出独立的单词数量。 实现这个功能的方法有很多,这里我们主要介绍Python编程语言中的实现方式,因为Python在处理文本数据时非常便捷。以下是一个简单的步骤: 1. *...

    C++双向链表统计文章单词出现频率

    在这个特定的项目中,“C++双向链表统计文章单词出现频率”是一个涉及数据结构和算法的应用,目标是实现一个程序来分析文本文件,计算并显示文章中每个单词出现的次数。双向链表作为数据结构的核心,其特点是每个...

    统计文章单词前五个数.zip

    标题中的“统计文章单词前五个数”提示我们这是一个与Python编程相关的项目,目的是统计文本(文章)中出现频率最高的前五个单词。这个项目可能涉及到文本处理、数据分析和结果展示等环节,是Python初学者和数据爱好...

    统计单词在文章中出现频率

    标题 "统计单词在文章中出现频率" 描述的是一个C++编程任务,目的是设计并实现一个程序,能够读取一个包含英文文章的文本文件,分析其中的单词,并统计每个单词出现的次数。最终,程序会将这些信息写入另一个文件,...

    用VC实现判断文章中单词个数

    本篇文章将深入探讨如何使用VC来实现一个简单的程序,以计算文章中的单词个数以及行数。这个功能在文本处理、数据分析或自然语言处理(NLP)的初级项目中非常常见。 首先,我们需要理解“单词”的定义。在大多数...

    英文文章单词统计(C语言代码)

    一个用C语言写的统计英文文章单词的源程序,注释清楚,代码简洁,主要用链表结构实现,能够正确运行,里面统计时把数字和其他字母等也统计为一个单词,可以在统计的方法里面进行修改,方便学习参考

    统计一篇文章中每个单词的个数

    本文将深入探讨如何使用编程技术统计一篇文章中每个单词的个数,这通常涉及文本预处理、字符串操作和词频统计等概念。 首先,我们需要一个小程序来读取文章内容。这个"Statistical words.exe"很可能就是这样一个...

    用数组方法实现从文件中读取单词并统计单词个数

    ### 使用数组方法实现从文件中读取单词并统计单词个数 #### 背景介绍 在编程领域,经常需要处理文本文件中的数据,比如统计文件中特定单词出现的次数等。这种需求常见于文本分析、词频统计等领域。本篇文章将通过一...

    统计单词数

    统计一篇文章的单词个数,输出单词个数,如time time time 输出为3

    查找英语文章中要出现的单词,统计其个数

    至此,我们就完成了一个简单的查找并统计英语文章中特定单词个数的任务。在实际应用中,可能还需要处理更多复杂情况,如处理多篇文章、去除停用词、识别词形变化等,但这个基本流程提供了一个很好的起点。

    文章中单词出现次数统计代码

    这是自己弄得简单的文章单词出现次数统计,都是些很基础的知识,主要是文件IO的简单应用,在此基础上的很多功能还没去实现,对于简单的应用和练习,有一定的参考意义

    英文文章各单词数目统计

    标签“文章单词数目”进一步强调了这个工具的核心功能,即统计英文文章中的单词数量。这可能涉及到对文本进行分词,识别单词边界,并排除一些非单词元素,如标点符号、数字等。 从压缩包子文件的文件名称...

Global site tag (gtag.js) - Google Analytics