`

中文字母简写搜索

    博客分类:
  • j2ee
阅读更多


public class ChineseTools {
  /**
   * 存放国标一级汉字不同读音的起始区位码
   */
  static final int[] secPosValueList = {
      1601, 1637, 1833, 2078, 2274, 2302, 2433, 2594, 2787, 3106, 3212, 3472,
      3635, 3722, 3730, 3858, 4027, 4086, 4390, 4558, 4684, 4925, 5249, 9999};

  /**
   * 存放国标一级汉字不同读音的起始区位码对应读音
   */
  static final char[] firstLetter = {
      'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'j', 'k', 'l', 'm', 'n', 'o', 'p',
      'q', 'r', 's', 't', 'w', 'x', 'y', 'z'};

  /**
   * 获取一个字符串的拼音码
   * @param oriStr
   * @return
   */
  public static String getFirstLetter(String oriStr) {
   String temp = "";
   try
   {
    temp=getFirstLetter(oriStr,0);
   }
   catch( UnsupportedEncodingException e)
   {
    e.printStackTrace();
   }
      return temp;
  }

  /**
   * 获取一个字符串的拼音码
   * @param oriStr
   * @param scale 返回的拼音字头的位数
   * @return
 * @throws UnsupportedEncodingException
   */
  public static String getFirstLetter(String oriStr,int scale) throws UnsupportedEncodingException {
    String str = oriStr.toLowerCase();
    StringBuffer buffer = new StringBuffer();
    char ch;
    char[] temp;
    for (int i = 0; i < str.length(); i++) {
      //依次处理str中每个字符
      ch = str.charAt(i);
      temp = new char[] {
          ch};
      byte[] uniCode = new String(temp).getBytes("GBK");
      if (uniCode[0] < 128 && uniCode[0] > 0) {
        // 非汉字
        buffer.append(temp);
      }
      else {
       //flt002 如果是“晖”字直接输出H      
       if('晖'==ch){
        buffer.append("H");
       }else{
        buffer.append(convert(uniCode));
       }     
      }
    }
    if(buffer.toString().length()<scale||scale==0) {
      return buffer.toString().toUpperCase();
    }
    else {
      return buffer.toString().substring(0,scale).toUpperCase();
    }
  }

  /**
   * 获取一个汉字的拼音首字母
   * @param bytes
   * @return
   */
  static char convert(byte[] bytes) {
    char result = '-';
    int secPosValue = 0;
    int i;
    for (i = 0; i < bytes.length; i++) {
      bytes[i] -= 160;
    }
    secPosValue = bytes[0] * 100 + bytes[1];
    for (i = 0; i < 23; i++) {
      if (secPosValue >= secPosValueList[i] &&
          secPosValue < secPosValueList[i + 1]) {
        result = firstLetter[i];
        break;
      }
    }
    return result;
  }

  /**
   *
   * @param args
   */
  public static void main(String[] args) {

//      System.out.println(ChineseTools.getFirstLetter("I love u"));
//      System.out.println(ChineseTools.getFirstLetter(""));
//      System.out.println(ChineseTools.getFirstLetter(""));
   System.out.println("张三爱中文汉字");
   System.out.println(ChineseTools.getFirstLetter("张三as中文汉字"));
  }

}

分享到:
评论

相关推荐

    史上最强大的select控件(可搜索的下拉框),支持汉字中文、拼音首字母、英文搜索方式

    史上最强大的select控件(可搜索的下拉框),支持汉字中文、拼音首字母、英文搜索方式 依赖高版本的jquery ,适应各种高版本的浏览器。 调用方法: 对任意一个&lt;select id="select1"&gt; 不需要做任何改动,只需加入以下...

    OD中文搜索插件

    OD中文搜索插件是一款专为优化中文搜索体验而设计的工具,主要应用于OD(可能是某个软件或平台的缩写)环境中。它旨在提高用户在处理大量中文数据时的查找效率,提供更为精准和便捷的搜索服务。下面我们将深入探讨这...

    pinyin支持汉字转换拼音,汉字转换拼音缩写

    在IT行业中,汉字转换拼音是一项重要的...总的来说,汉字转换拼音技术是中文信息处理的重要基础,而这个工具或库则提供了便捷的汉字到拼音和拼音缩写的转换服务,对于开发相关应用的程序员来说,具有很高的实用价值。

    zm.rar_zm11.com字幕网_字幕网zm

    "zm"可能是项目或者文件的缩写,具体含义可能需要通过源码分析来确定。 【描述】中提到"字幕滚动程序源码和小部分注释",意味着这份源码可以用于学习或自定义字幕滚动效果。源码是程序的原始编写形式,通过阅读源码...

    vba拼音搜索类-支持拼音简写,全拼,汉字搜索

    本知识点主要介绍一个VBA类模块,它专门设计用于实现拼音搜索功能,支持拼音简写、全拼以及汉字搜索。这种功能在处理大量中文数据时非常有用,能够帮助用户快速定位和检索信息。 类(Class)是面向对象编程的基础,...

    前端js全拼简拼搜索汉字

    前端不作很严格的要求进行部份字段的简拼、全拼字段的搜索汉字,不严格要求可以使用,基本包含常用汉字。

    根据输入的汉字获得简写拼音

    在IT领域,尤其是在编程和软件开发中,将汉字转换为简写拼音的需求广泛存在,特别是在自动化处理、数据输入、搜索引擎优化或本地化等场景。本文将深入探讨如何使用C#编程语言来实现这一功能。 首先,我们需要理解的...

    中文转拼音缩写

    标题 "中文转拼音缩写" 暗示了这是一个关于将中文转换为拼音缩写的程序或库,可能是用于实现特定的搜索、输入或者文本处理功能。这个程序是使用ASP.NET框架,这是一种常用的微软开发Web应用程序的技术,它基于C#语言...

    java的中文拼音搜索jar包

    5. **简写与全拼**:`pinyin4j`还支持转换为拼音的缩写形式,例如“北京大学”可以转换为“PKU”,这在某些场景下可以提高搜索效率。 在实际使用`pinyin4j-core-2.5.0.jar`时,开发者通常需要通过Maven来管理依赖,...

    Delphi获取汉字拼音缩写源码

    用delphi写的一个获取汉字拼音缩写的小程序,可以获取单个汉字及多个汉字,但有极少数汉字的拼音获取不到,附有可执行文件和源码! ///////////////////////////////////////////////////// 若有疑问,欢迎...

    SrtEdit 字幕编辑器

    Srt是SubRip的缩写,是最常见的字幕格式之一,主要用于存储电影或视频的文本字幕,其结构简单,易于编辑和交换。Ssa(SubStation Alpha)则是一种更先进的字幕格式,除了基本的字幕文本外,还支持字体样式、颜色、...

    汉字转拼音,关键字搜索心得

    在IT领域,尤其是在文本处理和信息...总的来说,汉字转拼音和关键字搜索是中文信息处理的关键技术,它们在各种应用场景中发挥着重要作用。通过不断学习和实践,我们可以更好地掌握这些技术,提高软件和服务的用户体验。

    delphi 将汉字翻译成拼音缩写的函数

    在 Delphi 开发环境中,有时我们需要处理汉字与拼音之间的转换,特别是将汉字转换为拼音首字母缩写,这对于构建搜索功能或者实现其他文本处理任务非常有用。本文将详细介绍一个用于将汉字翻译成拼音首字母的 Delphi ...

    汉字转拼音缩写,很强大的

    这种技术在中文信息处理中非常常见,尤其是在输入法、搜索引擎优化、姓名缩写等方面有着广泛的应用。通过将汉字转换成拼音首字母,可以大大提高信息检索和处理的速度与效率。 ### 二、应用场景 #### 1. 输入法 在...

    IDEA将汉字转换为拼音首字母缩写的插件

    简介:自己写的IDEA插件,可以将汉字转换为拼音缩写的插件,有需要的可以下载玩玩。 用法:下载之后正常进行插件安装,安装之后在Edit菜单里面会出现ChineseToPY选项,选中文字之后点击这个选项就可以将所选的文字...

    .net把汉字转换成拼音首字母缩写

    ### .NET中将汉字转换为拼音首字母缩写的实现方法 在.NET开发环境中,经常会遇到对文本进行处理的需求,其中一个常见的需求就是将汉字转换为其对应的拼音首字母缩写。这种功能在很多场景下非常有用,比如姓名的拼音...

    汉字字符串转化为拼音首字母缩写(限常用字)的小程序与源码(VC++)

    在IT领域,尤其是在编程实践中,有时我们需要将汉字字符串转换成其拼音首字母缩写,这在处理中文数据、创建搜索引擎关键词或实现特定的文本处理功能时非常有用。本项目提供了一个小程序及其源码,用于实现这个功能,...

    卡拉ok字幕的简单实现

    7. **MFC库**:MFC是Microsoft Foundation Classes的缩写,它提供了面向对象的C++封装,简化了Windows编程。可以使用MFC的`CWnd`类创建窗口,`Ctimer`类处理定时事件,以及`CFont`类管理字体对象。 8. **资源管理**...

    汉字转拼音及拼音缩写(2.0)

    在IT行业中,有时候我们需要将汉字转换为拼音,或者进一步处理为拼音缩写,这在诸如搜索引擎优化、语音识别、自然语言处理等领域具有广泛的应用。"汉字转拼音及拼音缩写(2.0)"是一个可能的C# WinForm应用程序,它...

    根据汉字查看拼音缩写

    根据汉字查看首字母拼音缩写;汉字转拼音。

Global site tag (gtag.js) - Google Analytics