论坛首页 Java企业应用论坛

一个看似简单的问题,头大了

浏览 2293 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2006-03-17  
想在Servlet中实现自动检测用户输入的字符的语言,我初步的想法是不管什么都先转换成UTF-8编码,然后再进行判断。比如如果是中文的话可以使用如下代码:
import java.util.regex.*;
public class Test{
       public static void main(String[] args);         {
               String str = "Chinese-中文";
               String regEx = "[\u4e00-\u9fa5]";
               Pattern p=Pattern.compile(regEx);;
               Matcher m=p.matcher(str);;
               boolean hasChinese=m.find();;
               if (hasChinese);                {
                       System.out.println("字符串含有中文字符");;
               }else{
                      System.out.println("字符串中没有中文字符");;
               }
      }
}

按照上述代码的思路也可以检测日文字符和韩国语字符。但是上述代码无法辨别是简体中文还是繁体中文,也无法辨别法语、德语。
征求大家的好点子.

Jet
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics