今天写程序的时候遇到一个问题,就是如果把一句话中的单词从这句话中分离出来
比如:Always bear in mind that your own resolution to success is more import than anything!
那么就把每个单词都分离开显示,以便进一步对分离的单词进行操作
实现起来很简单,即用到split方法和正则表达式的结合即可
import java.util.Scanner;
public class Test01 {
public static void main(String args[])
{
Scanner input=new Scanner(System.in);
String str = input.nextLine();
String[] arr=str.split("[^a-zA-Z0-9]+");
for(int i=0;i<arr.length;i++)
System.out.println(arr[i]);
System.out.println("There are "+arr.length+" words in the line!");
}
}

这样,就将里面的单词,分离出来了,如果有数字的话,也可以分离开来
下面就说说split方法的使用
一、split方法
java.lang.string.split
功能:将一个字符串分割成子字符串,然后将结果作为字符串数组返回
用法:stringObject.split([separator,[limit]])
split方法的结果是一个字符串数组,在stringObject中每个出现separator的位置都要进行分解
stringObject为必选项,就是要被分解的String对象或者文字,该对象不会被split方法修改
separator为可选项。字符串或者正则表达式对象,它标示了分离字符串时使用的是一个还是多个字符,如果忽略该选项
返回包含整个字符串的单一元素的数组。
limit可选项:这个值用来限制返回数组中元素个数
例子1:
public class Test01 {
public static void main(String args[])
{
String str = "what is your name";
String s[] = str.split(" ");
for(int i = 0; i < s.length; i++)
{
System.out.println(s[i]);
}
}
}
运行结果:
what
is
your
name
例子2:
public class Test01 {
public static void main(String args[])
{
String str = "what is your name";
String s[] = str.split(" ",3);
for(int i = 0; i < s.length; i++)
{
System.out.println(s[i]);
}
}
}
运行结果:
what
is
your name
例子3:
public class Test01 {
public static void main(String args[])
{
String str = "192.168.10.1";
String s[] = str.split("\\.");
for(int i = 0; i < s.length; i++)
{
System.out.println(s[i]);
}
}
}
运行结果:
192
168
10
1
这里会看到,split方法里多了两个斜杠,如果去掉斜杠后,运行,会发现,没有任何结果,其实split(String regex)方法中的regex是一个正则表达式,而.在正则表达式中有其他的意思,所以需要进行转义才可以用
下面的是从网上找到的
[size=12px]1。^\d+$ //匹配非负整数(正整数 + 0)
2。^[0-9]*[1-9][0-9]*$ //匹配正整数
3。^((-\d+)|(0+))$ //匹配非正整数(负整数 + 0)
4。^-[0-9]*[1-9][0-9]*$ //匹配负整数
5。^-?\d+$ //匹配整数
6。^\d+(\.\d+)?$ //匹配非负浮点数(正浮点数 + 0)
7。^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$ //匹配正浮点数
8。^((-\d+(\.\d+)?)|(0+(\.0+)?))$ //匹配非正浮点数(负浮点数 + 0)
9。^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$ //匹配负浮点数
10。^(-?\d+)(\.\d+)?$ //匹配浮点数
11。^[A-Za-z]+$ //匹配由26个英文字母组成的字符串
12。^[A-Z]+$ //匹配由26个英文字母的大写组成的字符串
13。^[a-z]+$ //匹配由26个英文字母的小写组成的字符串
14。^[A-Za-z0-9]+$ //匹配由数字和26个英文字母组成的字符串
15。^\w+$ //匹配由数字、26个英文字母或者下划线组成的字符串
16。^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$ //匹配email地址
17。^[a-zA-z]+://匹配(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$ //匹配url
18。匹配中文字符的正则表达式: [\u4e00-\u9fa5]
19。匹配双字节字符(包括汉字在内):[^\x00-\xff]
20。应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;}
21。匹配空行的正则表达式:\n[\s| ]*\r
22。匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/
23。匹配首尾空格的正则表达式:(^\s*)|(\s*$)
* 正则表达式用例
* 1、^\S+[a-z A-Z]$ 不能为空 不能有空格 只能是英文字母
* 2、\S{6,} 不能为空 六位以上
* 3、^\d+$ 不能有空格 不能非数字
* 4、(.*)(\.jpg|\.bmp)$ 只能是jpg和bmp格式
* 5、^\d{4}\-\d{1,2}-\d{1,2}$ 只能是2004-10-22格式
* 6、^0$ 至少选一项
* 7、^0{2,}$ 至少选两项
* 8、^[\s|\S]{20,}$ 不能为空 二十字以上
* 9、^\+?[a-z0-9](([-+.]|[_]+)?[a-z0-9]+)*@([a-z0-9]+(\.|\-))+[a-z]{2,6}$邮件
* 10、\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*([,;]\s*\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*)* 输入多个地址用逗号或空格分隔邮件
* 11、^(\([0-9]+\))?[0-9]{7,8}$电话号码7位或8位或前面有区号例如(022)87341628
* 12、^[a-z A-Z 0-9 _]+@[a-z A-Z 0-9 _]+(\.[a-z A-Z 0-9 _]+)+(\,[a-z A-Z 0-9 _]+@[a-z A-Z 0-9 _]+(\.[a-z A-Z 0-9 _]+)+)*$
* 只能是字母、数字、下划线;必须有@和.同时格式要规范 邮件
* 13 ^\w+@\w+(\.\w+)+(\,\w+@\w+(\.\w+)+)*$上面表达式也可以写成这样子,更精练。
14 ^\w+((-\w+)|(\.\w+))*\@\w+((\.|-)\w+)*\.\w+$ [/size]

- 大小: 8.5 KB
分享到:
相关推荐
捷方式了,它还实施了一条规约,那就是一个字符串各个分离的部分包含的是完全相同的字符.例如:下面的正则表达式匹配的就是位于单引号或双引号之内的所有字 符.但是,它要求开始和结束的引号匹配(例如两个都是双引号...
1. **capitalize** - 首字母大写:此操作符将字符串的第一个字符转换为大写,其他字符保持不变。如`{$title|capitalize}`。 2. **count_characters** - 计算字符数:返回字符串中的字符总数,包括空格和特殊字符。...
15. A,B,C,D,E五个人合伙夜间捕鱼,凌晨时都疲惫不堪,各自在河边的树丛中找地 方睡着了,日上三竿,E第一个醒来,他将鱼数了数,平分成五分,把多余的一条扔进河中, 拿走一份回家去了,D第二个醒来,他并不...
15. A、B、C、D、E 五个人合伙夜间捕鱼,凌晨时都疲惫不堪,各自在河边的树丛中找到地方睡着了,日上三竿,E 第一个醒来,他将鱼数了数,平分成五分,把多余的一条扔进河中,拿走一份回家去了,D 第二个醒来,他并不...
第一章 绪论 1.1. 选题背景 这几年,许多新名词涌入我们的视野:博客、圈子、播客、WAP等。这些都预示着我们进入了一个新的互联网阶段web 2.0,它是相对web 1.0的新的一类互联网应用的总称,是一次从核心内容到外部...