`
Mysun
  • 浏览: 273464 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

正则表达式计算单词出现次数

阅读更多
给定一段文本,使用正则表达式计算该文本中不同单词的出现次数。

/*
	 * 使用正则表达式来计算一段文本当中所有以小写字母开头的
	 * 单词的出现次数
	 */
	public void testRegex(){
		String POEM =
			"Towas brillig, and the slithy toves\n" +
			"Did gyre and Gimble in the wabe.\n" +
			"All mimsy were the borogoves,\n" +
			"And the mome raths outgrabe.\n\n" +
			"Beware the Jabberwock, my son,\n" +
			"The jaws that bite, the claws that catch.\n" +
			"Beware the Jubjub bird, and shun\n" +
			"The frumious Bandersnatch.";
		Map<String, Integer> wordCount = new HashMap<String, Integer>();
               //\\b用来指定单词的边界,这里在单词的开头和结尾都使用了\\b。用来
               //区分各个单词。中间的\\w+指明一个活着多个单词字符(word character)
		Matcher m = Pattern.compile("\\b([a-z]\\w+[a-zA-Z]){1}\\b").matcher(POEM);
			
			while(m.find()) {
				if(wordCount.containsKey(m.group(0))){
					Integer count = wordCount.get(m.group(0));
					wordCount.put(m.group(0), count+1);
				}else{
					wordCount.put(m.group(0), 1);
				}
			}
			System.out.println(wordCount.toString());
	}
分享到:
评论

相关推荐

    易语言正则表达式文本替换

    - `子程序_正则匹配数量`:计算文本中符合正则表达式的匹配次数。 3. **易语言中的正则表达式替换实例** - 基本替换:如将所有数字替换为星号,可以使用模式`\d`和替换字符串`'*'`。 - 分组替换:如果需要保留...

    使用正则表达式检测字符串中重复出现的词

    4. **创建词频字典**:使用Python的`collections.Counter`来计算每个单词出现的次数。 ```python from collections import Counter word_count = Counter(words) ``` 5. **筛选重复词**:找出出现次数大于1的单词...

    正则表达式.rar

    - 使用正则表达式可以编写代码统计程序,例如计算源码文件中的单词数量、行数或特定关键字出现次数。 7. **抓取网页中的email地址** - 正则表达式非常适合从HTML文本中提取电子邮件地址,通过定义符合电子邮件...

    正则表达式学习资料整理

    注意,正则表达式并不支持运算的优先级或括号,因此对于更复杂的计算,我们需要借助其他解析手段。 在实际应用中,正则表达式通常与编程语言结合使用,例如JavaScript、Python等,通过内置的正则函数进行匹配、查找...

    正则表达式验证工具Java

    和{n,m},用于指定前面的字符或字符集出现的次数。*表示零次或多次,+表示一次或多次,?表示零次或一次,{n,m}表示n到m次。 3. **预定义字符类**:如\.匹配任意字符(除了换行符),\w匹配字母、数字和下划线,\W...

    精通正则表达式基于.NET ASP PHP JSP JavaScript

    RegexApplication/Default.aspx 正则表达式类的应用 RegexApplication/GetPageHtmlData.aspx 获取网页的内容 第10章(/10/) ASPNETValidator/Compare.aspx 比较验证 ASPNETValidator/...

    正则表达式快速入门(案例讲解)

    ### 正则表达式快速入门(案例讲解) #### 一、正则表达式测试工具 在开始学习正则表达式的具体用法之前,首先要确保具备一个良好的测试环境。本章节介绍了一个基本的测试工具——Regex Test,它可以帮助我们更好...

    正则表达式大全学习文档

    ### 正则表达式大全学习文档 #### 一、引言 正则表达式是一种强大的文本处理工具,它能够帮助开发者高效地进行字符串搜索、替换等操作。在Web开发领域,尤其是在JavaScript中,掌握正则表达式的使用尤为重要。本...

    正则表达式经典实例

    5. 单词,文本行和特殊字符:这部分内容可能探讨如何使用正则表达式来匹配特定的单词、文本行,以及如何处理和匹配特殊字符。例如,`w`用于匹配任何单词字符,`n`匹配换行符,`t`匹配制表符等。这些特殊字符对于文本...

    易语言正则表达式模块应用

    ...)"允许我们在正则表达式中定义一个必须或不能出现在当前位置的模式。 7. **字符类**:方括号"[...]"内的字符集用于匹配其中的任意单个字符。例如,"[a-zA-Z0-9_]"匹配字母、数字和下划线。 8. **转义字符**:...

    正则表达式研究资料

    在该教程中,你将学习到正则表达式的基础概念,如字符类(用于匹配特定字符集合)、量词(用于指定匹配次数,如*、+、?、{n,m})、分组(用于捕获和重用匹配部分)、断言(如^表示行首,$表示行尾,\b表示单词边界)...

    正则表达式教程6寸PDF

    为了匹配特定格式的字符串,如电话号码,可以使用“0\d\d-\d{8}”这样的正则表达式,其中“\d”代表一个数字,“{2}”和“{8}”指定了前面的数字字符必须重复出现特定次数。 编写和测试正则表达式通常比较困难,...

    正则表达式入门经典教程

    元字符是正则表达式中具有特殊意义的字符,除了\b,还有用于匹配任意字符的点号(.),以及用于指定前面字符重复次数的星号(*)等。 正则表达式中还包括了多种其他元字符和语法结构,如字符类(用方括号[]定义一组字符...

    正则表达式使用帮助文档

    NFA支持更复杂的正则表达式,但可能需要更多的计算资源。 总结,正则表达式是一门深奥且强大的技术,学习并熟练掌握它能极大提高处理文本数据的能力。通过阅读《正则表达式.CHM》文档,你可以深入了解其原理,学习...

    正则表达式必知必会pdf

    目录 · · · · · ·第1章 正则表达式入门1.1 正则表达式的用途1.2 如何使用正则表达式1.3 什么是正则表达式1.4 使用正则表达式1.5 在继续学习之前1.6 小结第2章 匹配单个字符2.1 匹配纯文本2.2 匹配任意字符2.3 ...

    JAVA正则表达式语法大全

    - **量词**:用于指定模式出现的次数,如`*`(零次或多次)、`+`(一次或多次)等。 - **分组与引用**:通过圆括号`()`定义的子表达式。 #### 正则表达式规则实例详解 1. **匹配任何单个字符**: - 表达式:`1[ʽ...

    java正则表达式大全。。

    根据提供的标题、描述、标签及部分内容,我们可以整理出关于Java正则表达式的多个知识点。以下是对这些内容的详细解析: ### Java正则表达式基础知识 #### 1. 基本概念 - **正则表达式**:一种用于匹配字符串模式...

    Java正则表达式详解

    ### Java正则表达式详解 #### 一、正则表达式概述 正则表达式(Regular Expression),简称“regex”或“regexp”,是一种强大的文本处理工具。它通过一系列的字符和符号来描述一种抽象的模式,进而用于文本的查找...

Global site tag (gtag.js) - Google Analytics