`

中文字母简写搜索

    博客分类:
  • j2ee
阅读更多


public class ChineseTools {
  /**
   * 存放国标一级汉字不同读音的起始区位码
   */
  static final int[] secPosValueList = {
      1601, 1637, 1833, 2078, 2274, 2302, 2433, 2594, 2787, 3106, 3212, 3472,
      3635, 3722, 3730, 3858, 4027, 4086, 4390, 4558, 4684, 4925, 5249, 9999};

  /**
   * 存放国标一级汉字不同读音的起始区位码对应读音
   */
  static final char[] firstLetter = {
      'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'j', 'k', 'l', 'm', 'n', 'o', 'p',
      'q', 'r', 's', 't', 'w', 'x', 'y', 'z'};

  /**
   * 获取一个字符串的拼音码
   * @param oriStr
   * @return
   */
  public static String getFirstLetter(String oriStr) {
   String temp = "";
   try
   {
    temp=getFirstLetter(oriStr,0);
   }
   catch( UnsupportedEncodingException e)
   {
    e.printStackTrace();
   }
      return temp;
  }

  /**
   * 获取一个字符串的拼音码
   * @param oriStr
   * @param scale 返回的拼音字头的位数
   * @return
 * @throws UnsupportedEncodingException
   */
  public static String getFirstLetter(String oriStr,int scale) throws UnsupportedEncodingException {
    String str = oriStr.toLowerCase();
    StringBuffer buffer = new StringBuffer();
    char ch;
    char[] temp;
    for (int i = 0; i < str.length(); i++) {
      //依次处理str中每个字符
      ch = str.charAt(i);
      temp = new char[] {
          ch};
      byte[] uniCode = new String(temp).getBytes("GBK");
      if (uniCode[0] < 128 && uniCode[0] > 0) {
        // 非汉字
        buffer.append(temp);
      }
      else {
       //flt002 如果是“晖”字直接输出H      
       if('晖'==ch){
        buffer.append("H");
       }else{
        buffer.append(convert(uniCode));
       }     
      }
    }
    if(buffer.toString().length()<scale||scale==0) {
      return buffer.toString().toUpperCase();
    }
    else {
      return buffer.toString().substring(0,scale).toUpperCase();
    }
  }

  /**
   * 获取一个汉字的拼音首字母
   * @param bytes
   * @return
   */
  static char convert(byte[] bytes) {
    char result = '-';
    int secPosValue = 0;
    int i;
    for (i = 0; i < bytes.length; i++) {
      bytes[i] -= 160;
    }
    secPosValue = bytes[0] * 100 + bytes[1];
    for (i = 0; i < 23; i++) {
      if (secPosValue >= secPosValueList[i] &&
          secPosValue < secPosValueList[i + 1]) {
        result = firstLetter[i];
        break;
      }
    }
    return result;
  }

  /**
   *
   * @param args
   */
  public static void main(String[] args) {

//      System.out.println(ChineseTools.getFirstLetter("I love u"));
//      System.out.println(ChineseTools.getFirstLetter(""));
//      System.out.println(ChineseTools.getFirstLetter(""));
   System.out.println("张三爱中文汉字");
   System.out.println(ChineseTools.getFirstLetter("张三as中文汉字"));
  }

}

分享到:
评论

相关推荐

    service.subtitles.zimuku-2.1-HY.zip

    Zimuku是中国最大的字幕分享平台之一,拥有海量的中文字幕资源,覆盖了各种电影、电视剧、动漫和纪录片等。通过这款插件,Kodi用户可以直接在播放界面获取并应用Zimuku的字幕,无需离开应用程序去寻找合适的字幕文件...

    ffmpeg参数解释--中文详细

    ### ffmpeg参数详解——中文版 #### 一、通用选项概览 ffmpeg,作为一个强大的多媒体处理工具,提供了丰富的命令行选项,用于控制视频、音频及字幕的编码与解码过程。以下是对部分通用选项的详细解析: - **-L ...

    《计基》学考选择题测试.docx

    11. 汉字通常占用两个字节,1000个汉字需要2KB的存储空间。 12. Oracle是一个数据库管理系统,用于管理和存储大量结构化数据。 13. 更换性能更好的CPU可以直接提升计算机运行速度和整体性能。 14. CPU可以直接访问...

    HTML5标签整理

    - **`&lt;abbr&gt;`**: 用于表示缩写词。 - **`&lt;address&gt;`**: 显示文档作者或拥有者的联系信息。 - **`&lt;b&gt;`**: 强调文本,通常显示为粗体。 - **`&lt;bdi&gt;`**: 改变文本的方向。 - **`&lt;bdo&gt;`**: 明确地改变文本的方向。 - **`...

    html速查表

    - **`&lt;track&gt;`**: H5 新增,为 `&lt;audio&gt;` 或 `&lt;video&gt;` 元素定义文本轨道,例如字幕。 - **`&lt;video&gt;`**: H5 新增,用于插入视频文件。 #### 五、编程标签 - **`&lt;script&gt;`**: 插入客户端脚本,如JavaScript。 - **`...

Global site tag (gtag.js) - Google Analytics