第001号---一句字符串中分离单词

hualang

浏览: 765539 次
性别:
来自: 成都

最近访客更多访客>>

he00l

heweiping

冷月宫主

essencer

博主相关

博客

微博

相册

留言

关于我

博客专栏

: 高性能Web开发技术
浏览量：19796

: Android杂谈
浏览量：21380

: 玩转Android
浏览量：46985

文章分类

社区版块

存档分类

博客分类：

JAVA

正则表达式 prototype

今天写程序的时候遇到一个问题，就是如果把一句话中的单词从这句话中分离出来

比如：Always bear in mind that your own resolution to success is more import than anything!

那么就把每个单词都分离开显示，以便进一步对分离的单词进行操作

实现起来很简单，即用到split方法和正则表达式的结合即可

import java.util.Scanner;
public class Test01 {
	public static void main(String args[])
	{
		Scanner input=new Scanner(System.in); 
		String str = input.nextLine();
		
		String[] arr=str.split("[^a-zA-Z0-9]+");
		for(int i=0;i<arr.length;i++)
		      System.out.println(arr[i]);
		System.out.println("There are "+arr.length+" words in the line!");
	}
}

这样，就将里面的单词，分离出来了，如果有数字的话，也可以分离开来

下面就说说split方法的使用

一、split方法

java.lang.string.split

功能：将一个字符串分割成子字符串，然后将结果作为字符串数组返回

用法：stringObject.split([separator,[limit]])

split方法的结果是一个字符串数组，在stringObject中每个出现separator的位置都要进行分解

stringObject为必选项，就是要被分解的String对象或者文字，该对象不会被split方法修改

separator为可选项。字符串或者正则表达式对象，它标示了分离字符串时使用的是一个还是多个字符，如果忽略该选项

返回包含整个字符串的单一元素的数组。

limit可选项：这个值用来限制返回数组中元素个数

例子1：

public class Test01 {
	public static void main(String args[])
	{
		String str = "what is your name";
		String s[] = str.split(" ");
		for(int i = 0; i < s.length; i++)
		{
			System.out.println(s[i]);
		}
		
	}
}

运行结果：

what
is
your
name

例子2：

public class Test01 {
	public static void main(String args[])
	{
		String str = "what is your name";
		String s[] = str.split(" ",3);
		for(int i = 0; i < s.length; i++)
		{
			System.out.println(s[i]);
		}
		
	}
}

运行结果：

what
is
your name

例子3：

public class Test01 {
	public static void main(String args[])
	{
		String str = "192.168.10.1";
		String s[] = str.split("\\.");
		for(int i = 0; i < s.length; i++)
		{
			System.out.println(s[i]);
		}
		
	}
}

运行结果：

192
168
10
1

这里会看到，split方法里多了两个斜杠，如果去掉斜杠后，运行，会发现，没有任何结果，其实split(String regex)方法中的regex是一个正则表达式，而.在正则表达式中有其他的意思，所以需要进行转义才可以用

下面的是从网上找到的

[size=12px]1。^\d+$　　//匹配非负整数（正整数 + 0）
2。^[0-9]*[1-9][0-9]*$　　//匹配正整数
3。^((-\d+)|(0+))$　　//匹配非正整数（负整数 + 0）
4。^-[0-9]*[1-9][0-9]*$　　//匹配负整数
5。^-?\d+$　　　　//匹配整数
6。^\d+(\.\d+)?$　　//匹配非负浮点数（正浮点数 + 0）
7。^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$　　//匹配正浮点数
8。^((-\d+(\.\d+)?)|(0+(\.0+)?))$　　//匹配非正浮点数（负浮点数 + 0）
9。^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$　　//匹配负浮点数
10。^(-?\d+)(\.\d+)?$　　//匹配浮点数
11。^[A-Za-z]+$　　//匹配由26个英文字母组成的字符串
12。^[A-Z]+$　　//匹配由26个英文字母的大写组成的字符串
13。^[a-z]+$　　//匹配由26个英文字母的小写组成的字符串
14。^[A-Za-z0-9]+$　　//匹配由数字和26个英文字母组成的字符串
15。^\w+$　　//匹配由数字、26个英文字母或者下划线组成的字符串
16。^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$　　　　//匹配email地址
17。^[a-zA-z]+://匹配(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$　　//匹配url
18。匹配中文字符的正则表达式： [\u4e00-\u9fa5]
19。匹配双字节字符(包括汉字在内)：[^\x00-\xff]
20。应用：计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）
String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;}
21。匹配空行的正则表达式：\n[\s| ]*\r
22。匹配HTML标记的正则表达式：/<(.*)>.*<\/\1>|<(.*) \/>/
23。匹配首尾空格的正则表达式：(^\s*)|(\s*$)

* 正则表达式用例
* 1、^\S+[a-z A-Z]$ 不能为空不能有空格只能是英文字母
* 2、\S{6,}         不能为空六位以上
* 3、^\d+$          不能有空格不能非数字
* 4、(.*)(\.jpg|\.bmp)$ 只能是jpg和bmp格式
* 5、^\d{4}\-\d{1,2}-\d{1,2}$ 只能是2004-10-22格式
* 6、^0$            至少选一项
* 7、^0{2,}$        至少选两项
* 8、^[\s|\S]{20,}$ 不能为空二十字以上
* 9、^\+?[a-z0-9](([-+.]|[_]+)?[a-z0-9]+)*@([a-z0-9]+(\.|\-))+[a-z]{2,6}$邮件
* 10、\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*([,;]\s*\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*)* 输入多个地址用逗号或空格分隔邮件
* 11、^($[0-9]+$)?[0-9]{7,8}$电话号码7位或8位或前面有区号例如（022）87341628
* 12、^[a-z A-Z 0-9 _]+@[a-z A-Z 0-9 _]+(\.[a-z A-Z 0-9 _]+)+(\,[a-z A-Z 0-9 _]+@[a-z A-Z 0-9 _]+(\.[a-z A-Z 0-9 _]+)+)*$
*     只能是字母、数字、下划线；必须有@和.同时格式要规范邮件
* 13 ^\w+@\w+(\.\w+)+(\,\w+@\w+(\.\w+)+)*$上面表达式也可以写成这样子，更精练。
    14   ^\w+((-\w+)|(\.\w+))*\@\w+((\.|-)\w+)*\.\w+$ [/size]

查看图片附件

分享到：

玩转Android---组件篇---Handler的使用（1 ... | 玩转Android---事件监听篇---第2篇

2011-05-28 13:27
浏览 5369
评论(1)
论坛回复 / 浏览 (1 / 2413)
分类:编程语言
查看更多

1 楼 Hmily49 2011-05-28

看了，获益匪浅。

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

博客专栏

文章分类

社区版块

存档分类

最新评论