`

第001号---一句字符串中分离单词

    博客分类:
  • JAVA
阅读更多

今天写程序的时候遇到一个问题,就是如果把一句话中的单词从这句话中分离出来

比如:Always bear in mind that your own resolution to success is more import than anything!

那么就把每个单词都分离开显示,以便进一步对分离的单词进行操作

 

实现起来很简单,即用到split方法和正则表达式的结合即可

import java.util.Scanner;
public class Test01 {
	public static void main(String args[])
	{
		Scanner input=new Scanner(System.in); 
		String str = input.nextLine();
		
		String[] arr=str.split("[^a-zA-Z0-9]+");
		for(int i=0;i<arr.length;i++)
		      System.out.println(arr[i]);
		System.out.println("There are "+arr.length+" words in the line!");
	}
}

 

 

 

这样,就将里面的单词,分离出来了,如果有数字的话,也可以分离开来

 

下面就说说split方法的使用

 

一、split方法

java.lang.string.split

功能:将一个字符串分割成子字符串,然后将结果作为字符串数组返回

用法:stringObject.split([separator,[limit]])

split方法的结果是一个字符串数组,在stringObject中每个出现separator的位置都要进行分解

 

stringObject为必选项,就是要被分解的String对象或者文字,该对象不会被split方法修改

separator为可选项。字符串或者正则表达式对象,它标示了分离字符串时使用的是一个还是多个字符,如果忽略该选项

返回包含整个字符串的单一元素的数组。

limit可选项:这个值用来限制返回数组中元素个数

 

例子1:

public class Test01 {
	public static void main(String args[])
	{
		String str = "what is your name";
		String s[] = str.split(" ");
		for(int i = 0; i < s.length; i++)
		{
			System.out.println(s[i]);
		}
		
	}
}

 

运行结果:

what
is
your
name

 

例子2:

public class Test01 {
	public static void main(String args[])
	{
		String str = "what is your name";
		String s[] = str.split(" ",3);
		for(int i = 0; i < s.length; i++)
		{
			System.out.println(s[i]);
		}
		
	}
}

 运行结果:

what
is
your name

 

例子3:

public class Test01 {
	public static void main(String args[])
	{
		String str = "192.168.10.1";
		String s[] = str.split("\\.");
		for(int i = 0; i < s.length; i++)
		{
			System.out.println(s[i]);
		}
		
	}
}

 

运行结果:

192
168
10
1

 

这里会看到,split方法里多了两个斜杠,如果去掉斜杠后,运行,会发现,没有任何结果,其实split(String regex)方法中的regex是一个正则表达式,而.在正则表达式中有其他的意思,所以需要进行转义才可以用

 

 下面的是从网上找到的

[size=12px]1^\d+$  //匹配非负整数(正整数 + 0)
2^[0-9]*[1-9][0-9]*$  //匹配正整数
3^((-\d+)|(0+))$  //匹配非正整数(负整数 + 0)
4^-[0-9]*[1-9][0-9]*$  //匹配负整数
5^-?\d+$    //匹配整数
6^\d+(\.\d+)?$  //匹配非负浮点数(正浮点数 + 0)
7^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$  //匹配正浮点数
8^((-\d+(\.\d+)?)|(0+(\.0+)?))$  //匹配非正浮点数(负浮点数 + 0)
9^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$  //匹配负浮点数
10^(-?\d+)(\.\d+)?$  //匹配浮点数
11^[A-Za-z]+$  //匹配由26个英文字母组成的字符串
12^[A-Z]+$  //匹配由26个英文字母的大写组成的字符串
13^[a-z]+$  //匹配由26个英文字母的小写组成的字符串
14^[A-Za-z0-9]+$  //匹配由数字和26个英文字母组成的字符串
15^\w+$  //匹配由数字、26个英文字母或者下划线组成的字符串
16^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$    //匹配email地址
17^[a-zA-z]+://匹配(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$  //匹配url
18。匹配中文字符的正则表达式: [\u4e00-\u9fa5]
19。匹配双字节字符(包括汉字在内):[^\x00-\xff]
20。应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
String.prototype.len
=function(){return this.replace([^\x00-\xff]/g,"aa").length;}
21。匹配空行的正则表达式:\n[\s| ]*\r
22。匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/
23。匹配首尾空格的正则表达式:(^\s*)|(\s*$)

* 正则表达式用例
 
* 1^\S+[a-z A-Z]$ 不能为空 不能有空格  只能是英文字母
 
* 2、\S{6,}         不能为空 六位以上
 
* 3^\d+$          不能有空格 不能非数字
 
* 4、(.*)(\.jpg|\.bmp)$ 只能是jpg和bmp格式
 
* 5^\d{4}\-\d{1,2}-\d{1,2}$ 只能是2004-10-22格式
 
* 6^0$            至少选一项
 
* 7^0{2,}$        至少选两项
 
* 8^[\s|\S]{20,}$ 不能为空 二十字以上
 
* 9^\+?[a-z0-9](([-+.]|[_]+)?[a-z0-9]+)*@([a-z0-9]+(\.|\-))+[a-z]{2,6}$邮件
 
* 10、\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*([,;]\s*\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*)* 输入多个地址用逗号或空格分隔邮件
 
* 11^(\([0-9]+\))?[0-9]{7,8}$电话号码7位或8位或前面有区号例如(02287341628
 
* 12^[a-z A-Z 0-9 _]+@[a-z A-Z 0-9 _]+(\.[a-z A-Z 0-9 _]+)+(\,[a-z A-Z 0-9 _]+@[a-z A-Z 0-9 _]+(\.[a-z A-Z 0-9 _]+)+)*$
 
*     只能是字母、数字、下划线;必须有@和.同时格式要规范 邮件
 
* 13 ^\w+@\w+(\.\w+)+(\,\w+@\w+(\.\w+)+)*$上面表达式也可以写成这样子,更精练。
   
14   ^\w+((-\w+)|(\.\w+))*\@\w+((\.|-)\w+)*\.\w+$ [/size]

  • 大小: 8.5 KB
分享到:
评论
1 楼 Hmily49 2011-05-28  
看了,获益匪浅。

相关推荐

    字符串分析,分别输出字符串中个单词,并统计出单词个数

    ### 字符串分析,分别输出字符串中各单词,并统计出单词个数 #### 知识点解析 在Java编程语言中,对字符串进行分析是一项基本且重要的任务。本篇文章将详细解析如何通过Java代码实现字符串的分割以及统计其中单词...

    判断字符串中的单词个数

    根据给定的信息,我们可以从多个角度来探讨与“判断字符串中的单词个数”相关的知识点,包括C语言的基础语法、字符串处理、字符识别等。 ### C语言基础语法 #### 1. 包含头文件 在C语言编程中,通常会通过`#...

    7-65 字符串替换--字符串.c

    本题目来自PTA习题集,本人在同时学习的情况下,分享自己的练习情况!

    字符串最后一个单词的长度

    计算字符串最后一个单词的长度,单词以空格隔开。 输入 一行字符串,长度小于128。 输出 整数N,最后一个单词的长度。 样例输入 hello world

    292-用P0口显示字符串常量(51单片机C语言实例Proteus仿真和代码)

    292-用P0口显示字符串常量(51单片机C语言实例Proteus仿真和代码)292-用P0口显示字符串常量(51单片机C语言实例Proteus仿真和代码)292-用P0口显示字符串常量(51单片机C语言实例Proteus仿真和代码)292-用P0口显示字符串...

    PTA 6-13 函数实现字符串逆序

    在编程领域,字符串逆序是一种常见的操作,尤其在数据结构和算法的学习中。PTA(Programming Training Arena)是一个在线编程训练平台,它提供了各种练习题目来帮助学生提升编程技能。题目"PTA 6-13 函数实现字符串...

    Objective-C中字符串操作总结

    - `compare:`:用于比较两个字符串的顺序,返回三种可能的值:1表示第一个字符串大于第二个,0表示相等,-1表示小于。 - `caseInsensitiveCompare:`:忽略大小写进行字符串比较。 3. **大小写转换**: - `...

    截取用,分割的字符串中的第n个字符串 SQL

    根据给定的信息,本文将详细解释如何在SQL中实现截取用特定字符分割的字符串中的第n个子字符串。此需求通常应用于数据处理与分析场景中,尤其在处理半结构化或非结构化的文本数据时非常有用。 ### 核心知识点解析 ...

    C#上位机基础学习-基于S7.Net实现读取S7-1500PLC中的字符串变量.docx

    这里我们发现字符串的开头有一个不必要的字符,因此我们可以使用String类的Remove方法来删除第一个字符。这样,我们就能获取到正确无误的字符串了。 运行应用程序,点击button1,此时,文本框(textBox1)会显示从...

    HJ1-字符串最后一个单词的长度

    HJ1-字符串最后一个单词的长度

    字符串逆序 - 字符串逆序算法

    字符串逆序

    数据库字符串相加---字符串相加函数

    - 最后,使用`STUFF`函数移除第一个字符(即第一个逗号),并返回最终的结果字符串。 ```sql CREATE FUNCTION dbo.str1 (@f_fileNo varchar(500)) RETURNS varchar(8000) AS BEGIN DECLARE @r varchar(8000);...

    DreamCats#java-notes#434.字符串中的单词数1

    434. 字符串中的单词数题目统计字符串中的单词个数,这里的单词指的是连续的不是空格的字符。输出: 5解释: 这里的单词是指连续的不是空格的字符,所以 "Hel

    字符串逆序-使用C语言实现的字符串按单词逆序.zip

    在这个程序中,`reverse_words`函数遍历输入的字符串,每当遇到一个分隔符(空格、逗号、句号或感叹号),它就反转从上一个分隔符到当前位置之间的子字符串,即当前单词。`start`和`end`变量分别跟踪当前单词的起始...

    Node.js-string-width-得到字符串的视觉宽度显示所需的列数

    总的来说,`string-width`库提供了一种在Node.js环境中计算字符串在终端显示宽度的方法,解决了全宽字符、多字节字符和控制序列带来的复杂性。这对于任何需要在命令行界面上进行文本格式化的项目都是一个非常有价值...

    zifuchuan.rar_字符串_字符串倒序_字符串分离

    本教程主要围绕"字符串_字符串倒序_字符串分离"这一主题展开,通过提供的压缩包文件"zifuchuan.rar",我们可以深入理解并实践如何在C#中对字符串进行操作。 首先,我们关注"字符串倒序"这个概念。在C#中,字符串是...

    c语言删除字符串中指定的所有字符

    此代码示例提供了一种高效的方法来移除字符串中的特定字符,并且已经在Windows和Linux环境下进行了测试验证。 ### 一、理解需求 首先,我们要明确本程序的功能:删除一个字符串中所有出现的指定字符。例如,给定...

    易语言八种方法倒转字符串源码

    在易语言编程环境中,倒转字符串是一个常见的操作,可以用于各种文本处理任务。本文将详细介绍八种不同的方法来实现这一功能,并提供相应的源码。易语言作为一款中文编程语言,以其简洁直观的语法深受初学者和专业...

    ADO助手V1.20---一个获取ADO连接字符串,测试SQL命令的辅助软件

    ADO助手---一个获取ADO连接字符串,测试SQL命令的辅助软件 2010-09-06 +初始版本发布 ADO助手---一个获取ADO连接字符串,测试SQL命令的辅助软件 2010-09-06 +初始版本发布 2011-11-09 -修复有时候用DataGrid...

    在一个字符串中查找子串的个数

    - 如果找到了子字符串,则返回子字符串的第一个字符在当前字符串中的索引位置。 - 如果没有找到子字符串,则返回 -1。 ### 3. 示例代码分析 #### 3.1 导入必要的包 ```java import java.util.*; import java.io.*;...

Global site tag (gtag.js) - Google Analytics